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لايسمح بإعادة إصدار هذا الكتابء أو نقله في أي شكل أو وسيلة» 
سواء أكان إلكترونية أم يدوية أم ميكانيكية» بها في ذلك جميع أنواع تصوير المستندات بالنسخ» أو 
التسجيل أو التخزين. أو أنظمة الاسترجاع» دون إذن خطي من المركز بذلك. 
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بر > لط ييا 


فهرس الكتاب 


0 
كلمة المركز 


امقدمة 
الفصل الأول: مدخلٌ إلى حوسية النّفة ... 
ني شرفي 
اي 


0 التحدّيات التي تُواجه معالجة اللغة العربية 
ْ 4- التّمريف بتقنيات اللّغات الإنسائية. 
فق الؤشليات لمك حومط [لخةالعرجة. 


-١ 0‏ أفكارٌ بحي لأطرُو حاتٍ علمية مستبي 


الفصل اَن : التّحليل الصَّوقَ (الراسةالتطليقة اقرع اموي 


ش 0 الحديث) 
-١‏ تحليل الصوت اللغوي - ظ 


300و 


هذه الطبعة إهداء من المركز 
ولا يسمح بنشرها ورقيا أو تداولها تجاريا 
ا:6:6ا6ا ب | ييا 


0 00 00 0-0 اللا 0 
: الفصل 5 شيل 5 " 3 0 مسا م 
ظ 6م 0 
1 00 م ا 


7 - طبيعة البناء الصرفي للمفردات العربية . ا 
1 0 م 2011111 0 76 00 
١‏ 0 00 0 الا ار ْ 
١‏ 0 7-0 لل 1 5 
00 30 [ 00 
: ل 1 0 7 0 
3 ع مادا 
-١‏ تقد . السة 
1 00 0 0 0 0 ل ّ 3 
- مدخل إلى تركيب الجملة في علم اللغة . اها 
د 00 31011100 0 
: - اتجاهات بناء المحللات النحوية . 0 


4- بعض النقاط البحثية الهامة من أجل دعم خطة طريق لمعالجة التركيب في ' 
للع الع 


0 3 5 0 
0 ده 00 ال ةا 
اَي تيتا ٠‏ ا 
5 000 قلات ام 
ا 00 0 


- لديل الذلال يهل لتر الممْجَمي [ 1 
القصل لكام اللي المج اا م يي 0 ْ 0 7 ا 6 [ 
5 ٍ شير 00 000 ْ 3 ١‏ 1 ِ 
١‏ : - من أدرات المبكة آي 00 7 4 3 [ 0 1 
[ 0 0 200 7 000 


الباحثون 0 


هذه الطبعة إهداء من المركز 
ولا يسمح بنشرها ورقيا أو تداولها تجاريا 


كلمة المركز 


يعمل المركز في مجال البحث العلمي ونشر الكتب مستهدفاً التركيز على المجالات 
اليه التي مزالت بوجائه إل مسايط الصو غليهاء وتكت ليحت نيهاء ولفت انار 
الباحثين والجهات الأكاديمية إلى أهمية استثغارها بمختلف وجوه الاستثغار» وذلك مثل 
مجال (التخطيط اللغوي) و (العربية في العالم) و(الأدلة والمعلومات) و (تعليم العربية 
لأبناتها أو لغير الناطقين بها إلى غير ذلك من المجالاتء وإن من أهم مجالات البحث 
المستقبلية في اللغة العربية مجال (العربية والحوسبة » والذكاء الاصطناعي) حيث إن 
حياة اللغات ومستقبلها مرهونة بمدى تجاومها مع التطورات التقنية والعالم الافتراضي» 
وكثافة المحتوى الالكتروني المكتوبء. وهو ما يشكل تحديا حقيقيا أمام اللغات غير 
المنتجة للمعرفة أو للتقنية. 

وقد عمل المركز على تسليط الضوء على هذا المجال التخصصى؛ مستعينا بالكفاءات 
القادرة من المهتمين بالتخصص البيني (بين اللغة 0 جهودهم, وهادفاً 
إلى نشرهاء وتعميم مبادئهاء راغباً أن يكون هذا المسار العلمي مقررا في الجامعات في 
كلية العربية واحاسوبء ومجالا بحثيا يقصده الباحثون الأكاديميون, والجهات البحثية 


اعون 


هذه الطبعة إهداء من المركز 
ولا يسمح بنشرها ورقيا أو تداولها تجاريا 
:ا ييا 


وقد أصدر المركز سابقا ستة عشر كتاباً ختصا في (حوسبة العربية) وفي الإفادة من 
«المدونات اللغوية) في الأبحاث العربية» ويحتفل بإصدار سبعة كتب جديدة مختصة في 
(حوسبة العربية والذكاء الاصطناعي) » ويقدمها للقارئ العربي» وللجهات الأكاديمية؛ 
للإفادة منها في مناهج التعليم والبناء عليه» وهذه الكتب السبعة هي: (العربيّة والذّكاء 
الاصطناعيٌ؛ تطبيقات الذكاء الاصطناعي في خدمة اللغة العربية» خوارزميات الذكاء 
الاصطناعي في تحليل النص العربي» مقدمة في حوسبة اللغة العربية» الموارد اللغوية 
تاسوريف لاله الآلية للنصوص العربية» تطبيقات أساسية في المعالجحة الآلية للغة 
العريية): 

ويشكر المركز السادة مؤلفي الكتب. ومحرريهاء لما تفضلوا به من عمل علمي 
رصينء وأدعو الباحثين والمؤلفين إلى التواصل مع المركز لاستكال المسيرة» وتفتيق 
فضاءات المعرفة. 


وفق الله الجهود وسدد الرؤى. 


الأمين العام 
أ. د. محمود إسماعيل صالح 


حاةأت 


مع الطفرة المعلوماتيّة الي شَهِدَها القَرنُ الحادي والعشرون. أمكنّ إخضاع الآلة 


0 توص اناك السمة, وساعدٌ ذلكٌ في توفير الوقت والّهد البشريّ 
الإذواة و ساس بساك الامةا مسمز قاف كير مد موصي الل 


ول يه للد العربيّة بعناية الباحثينَ في مُعالّة اللّغات الطبعيّة في المشرق 
والمغرب؛ وساعدّت بعضٌ خصائص اللّغة العريية على تطوير أدواتٍ ناجعةٍ ناته 


آليّا عبر عدّة مُستويات» ومن وده لاسي الديه لقاب للصَّرف العربي الي 
كنقه دق تطويو أذوانف التحليل الصَرفٌ. وفي الوقت ذاته» مثلّت بعضُ خصائص 


العربيّة تحدياتٍ أمام حوسيتهاء مثل طبيعة نظامها الكتاي» وطبيعة بنيتها الرّكبية. 

وسعكا ل الرقوف عل :طرائق محا الآليّه للّغة العرييّة والتّحدّيات الي تُواجة 
حَوسَبتهاء ٠‏ فإِنّنا تدم للقارئ العريّ كتاب (مُقدّمة في حَوسَبة اللّخة العرييّة)» آملينَ 
أن يُسهمٌ في إثراء المكتبة العربية ّي تُعاني نقضًا كبيرًا في مصادر مُعاجّة اللّغة العربية 
وتقنياتها. ولعلّنا بذلكَ نفتحٌ البابَ مام الباحثينَ لطرق هذا الميدان وتنمية أساليب 
البحث فيه. 


حنادادت 


هذه الطبعة إهداء من المركز 
ولا يسمح بنشرها ورقيا أو تداولها تجاريا 
:ا ييا 


الح ل ل الرن ست ماله 
ما لد 
0 عل التّحا الي 


الفصل الأوّل: مدخل إلى حَوسَبة ة الل يُعنى بمفهوم حَوسَبة 5 وأبرز 
الاصطلاحات المستخدمة في التّبير عن هذا الميدان؛ ثم يعرض للتحدّيات 
الي تُواجة مُعاجَة الأغات الإنسانيّ؛ واللّغة العربيّة على وجه الخُصُوص. 
ويْقدّمُ الفصلٌ مَهيدًا حول تقنيات اللُغات الإنسانيّة ووظائفهاء ويعرض 
كلك تعرينا عضي اللشينات لد حركية النة الم 1 

الفصل الثاني: اتحابل الضوق؛ ويَعِرضُ دراسة تحليليّة للضّوت اللّغويّ في 
الصر الحديث؛ مُّقدٌ مُقدّمًا لذلكَ بأهمٌ الصطلحات المستَخدّمة في المحاسكَة الآليّة 
للصّوت اللّغويٌ ومفاهيمها. ويعرض هذا الفصلٌ لكيفيّة التَحليل الصّويّ 


الحاسوبّ» من خلال الإبانة عن الأجهزة الأساسيّة لحوسّبة الضّوت اللغويّ 
وكذلك الأدوات والبريجيّات السناعقة ف تحليل أصوات اللّغة. 


الفصل الثّالث: التّحليل الصَّرقّ الآ للمُفردات العربيّة؛ يُعنى هذا 'الفصل 
بطبيعة البناء الصَّرقّ في اللّغة العربيّة» ويُقَدّمْ م تصوُرًا الحجم حصيلة المفردات 
العربيّة. ٠‏ ويُقَدَمُ م تعريفًا للتّحليل الصَّرفٌّ اللي 'وتطبيقاته» والالتباس الصَّرفٌ 
وأساليب إزالته. ويعرض كذلكٌ للمواوذ الأدركة اللّأازمة لإزالة الالتباس 
الع 

الفصل الرّابع: التّحليل التَرَكبيَ؛ يُقَدُمْ هذا الفصلٌ تمهيدًا حول علاقة 
تر الس ُمّ مدخلا إلى تركيب الجملة في 
للح والمُحالَة الآلية خا . ويعرض كذلك كالب يناك الدللات التحرة 
[التَّكيبيّة] واتجاهاتها ودقتهاء مع التّمثيل عليها . ويعرض الفصل أيضًا لبعض 
قاط البح الى ساعد في تطوير مُعاجةالتكيب في النّخة العرية. 


1د 


* الفصل الخامس: التُحليل الدّلايّ؛ يُّقدمُ مدخلا للتّحليل الدّلانّ في اللّغات 
الطبيعيّة عمومّاء وفي اللّغة الغرب عل رجه الخصوص. ويعرضٌ لشبكات 
الدّلالات المعجميّة ىما يعرضٌ للالتباس الدَّلايّ وأساليب إزالته» ويعرض 
كذلك لتطبيقات التّحليل الدَّلالىّ والعَنونة الدّلاليّ للمُدوَّنات اللّْويّة. 

٠‏ الفصل السّادس: التّحليل ا معجميّ الآن؛ ويأتي هذا الفصل تتمّة تتمّة مستويات 
التُحليل لخي حيثُ يُقدَم لفهوم التُحليل ا معجميّ» ٠‏ ويعرضٌ المكوّنات 
المحجم اللُغويّ» سواء : أكانت مُكوّناتٍ أساسيّة أم ثانويّة. ٠‏ ويْقَدَمُ 0 
للمُعاجَة امحجميّة الآليّه في مراحل الصّناعة المعجميّة, جمعًا وتحريرًا ونشرٌ 
ويعرض كذلك لأدوات العالّة الآليّة مكوّنات المعجم اللخَويَ؛ 0 
على المعجم العري. 

إَِّنا نأمل أن يِجدَ القارئٌ الكريمٌ في هذا الكتاب مُقدّمةٌ وافيةً لحوسّبة اناري 


تُعينُْ على فهم منطق الآلة في الحاجَة الآليّة لُرّدات اللّغة وتراكيبهاء بصورَتَيها : المنطوقة 
0 ل اي له 


نسألَ الله تعالى أن يتقبّل هذا الجهدَ بالذّكر الْحَسَنِ والأجر الجزيل» وأن يجعلّه من 
العلم الذي ينفح أصحابّه بعد مماتهم. 
ربّنا عليكٌ توكّلنا وإلِيكٌ أنّبنا وإليكٌ المصير. 


القكاراة 


1 


هذه الطبعة إهداء من المركز 
ولا يسمح بنشرها ورقياً أو تداولها تجارياً 


حاؤنات 


الفصل الأول 
مدخل إلى حوسبة اللغة 


ب 
د. يحسن رَشُوان 


-١‏ مُستويات التحليل العو 

؟- الّحرٌّيات الي تواجه تقنيات اللّخات الإنسانيّة. 
*- التّحدٌّيات التي يُواجه معالجحة اللغة العربية. 

4ت لتر يني بتقيات اللحات الاسساية. 

وده اأكانع ام بصونية ا للع اعرف 
ا و ديك انط رجن م علد فش 


-160- 


هذه الطبعة إهداء من المركز 
ولا يسمح بنشرها ورقيا أو تداولها تجاريا 


ات 


0-3 


مهيد 
هذا كنات سويد اللحة الجر اونا ع ييا ع لافقا وسودية الله 
علمٌ حديثٌ نسبيّاء ظهرٌ في مطلع التُصف الثاني من القرن العشرين باعتباره علا بيزباء 
يُعتَّمَدٌ فيه على الحاسوب لدراسة اللّغات الإنسانيّة وفهم طبيعتها. 
كنا إلى هذا العلم ممتكات اخرى 0 أهمّها: اللْسانئّات الحاسوبيّة 
([0) - وع1و1تاعطاءآ 112610221امحطه0))» و مُعاجة اللكنات الميوة (لمختطةكح 
طآلا - عمضزووءه2]:0 عع 2ناع1].380)» وتقنيات الّخة الطَبيعِيّة (الإنسانيّة) (مقحصدك]1 
811 - 1 ]) . ومع و اك وتفاوت أساليب 
دراستها بين ار والحاسوبيين» إل أَنََّا تدورٌ حميعًا في دائرة واحدة» هي دائرة 
ذلك العلم الذي ُوَجَهُ من خلاله أنظمة الحاسوب إلى فهم لعا الامسان وضاكاة الذكاء 
وتقومٌ حوسبةالّفة على ثلاثة محاور أساسيّة هي : 
»؟ تقنيات معالحة العيومن (عستووء هآ 1). ومن أمثلتها: الَرّحمة الآ 
والتلخيص الأَلّ» والتّنقيب في النصوص. 
» تقنيات معالحة الكلام المنطوق (2]00655108 اءء506). ومن أمثلتها: التَّعَدّف 
الآيّ على الكلام المنطوقء وتحويل النّضّ المكتوب إلى كلام منطوق. 
# تقيات معاطة العو (عضذووءعء2]:0 عع11128). ومن أمثلتها: التَعَرّف الآنٌّ على 
الكتابة (0)0015 - 00 تمع معع 1 تعاعة تقطن 1وعنام0). ْ 


-/ااط- 


هذه الطبعة إهداء من المركز 
ولا يسمح بنشرها ورقيا أو تداولها تجاريا 
:ا | ييا 


3 0 
-١‏ مُستويات التُحليل اللّمَويّ 
نود أن نُشِيرَ د يداية - إلى ما جرى عليه الباحثون في حوسبة اللّْة من ترتيب مراحل 


لتُحليل اللَخَِيَ في لم ُكّوِيّ على النّحو الموضّح في الشّكل التَلي: 


التحليل المعجمىّ وأ زلقصة لدعتدع.1 


التحليل اللاي وزو جولقصه عتصفدسه 


التتحليل التكبي كذزو5لقطة عناع2 )موك 


التحليل الصَّرف وزو ؤلوصة لوءنع10مطم:ه310 


التحليل الفونولوجيّ و217:51هه لوءأع10مصمطم 


الشّكل 1-1: مستويات التُحليل اللّمَويْ وفق ما جرح عليه الباحفون. 
ووفقًا للعديد من اللّخات الإنسانيّة يج بنا أن تُشير إلى وُجود تداملٍ وارتباطٍ بين 
مُستويات التّحليل اللْعَويّ؛ وإذا اعتبرنا أنَّ هذه المستويات مُكل مجموعة من الدّرَجَات 
المتعاقبة» فباستطاعتنا أن تَتَنَ طبِيعَتّها وماهيّّها على النّحو التَّالى: 


حارات 


ا التُحليل الفونولو جيّ (وأوتزإلقسة لدعاعه1[مصمطط) 

ويتم في هذه الذّرجة حسم طريقة ة نُطق الكلمة مع مُراعاة البُرُوف التي لا تُنطق أو 
الي يتطق على غير أصلها (كالحررّوف المدغعمة وَالحررّوف الع يلنقي فيها الساكنان). 
ويُعَدذٌ علومٌ النّجويد الوسيلة الأساسيّة الي تُساعد على معرفة قواعد تُطق القرآن 
الكريم» مع ملاحظة الاين بينها وبينَ قواعد تُطق العربيّة القصحى في عَُمُومِها 

وتواحهنا ف الفرية > خصوضا - صعوبةٌ تكمنُ في عدم استخدام الحركات 
القصيرة (15ء701 16مط5)» وهذا يجعل إنجار آليّة النُطق الى لكليات العرية مهمة 
جد نقار وها م الأخاك اي راسي فى تتادي ار نات اليرة ار 
مثل العديد من اللّغات اللاتيئة 


-”.١‏ التَحليل الصَّر فُُ (5أ55لقطهة لدعأع10مطم05101) 

ويتم في هذه الدرجة تحليل الكلمة إلى عناصرها الأساسيّة (السَّابق والجذع 
واللأأحق)؟ ووفمًا لطبيعة اللّغة العربيّة الاشتقاقيّة يوجد للكلمة العربية - عادةً - أكثر 

من احتهال» إلا ّنا نستطيع اخحتيارٌ الاحتهال الأكثر مناسبة من خلال السّياق. ٠‏ ويتم م هذا 
الاختيار باستخدام الطَرّق الإحصائيّة التي سناع - كذلك - في تحديد أقسام الكلام 
(طعععم5 01 كتتةط) وماهان عامرة تر صرتات: 


-#”#.١‏ التُحليل النّحو يُ (كت د ولهسة عنفعونموة) 

لع شرا سا نيم 
اتوي ومن يزيد الأ شعوية في الخ لحري نظا مروتها فير تيب كنات 
الجملة (كأن يتقد يتقدّمَ الخبر على المبتداً أو يتأخَر الفاعل عن المفعول). 

ومن ناحية أخرئ» لا يمكن امل .دون المعلن عند التخليل الكّرق فى محديد 
الوظيفة النحويّة للكلمة. ومثال ذلك كلمة (عامل)؛ فهي من الناحية الصّرفيّة (اسم 
فاعل) من الفعل (حَمِلَ)» لكنّها من النّاحية النّحوِيّة تصلّحُ فاعلاً أو مفعولا أو نعنًا أو 


غَيرذللك. 
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هذه الطبعة إهداء من المركز 
ولا يسمح بنشرها ورقيا أو تداولها تجاريا 
:ا ييا 


-:,.١‏ التتحليل الدَّلاٌ (15أسكلقسة عتأسصمدى5) 
وللتّحليل اللاي درجاتٌ عديدةٌ» أدناها تحديد دلالة الكلمة في سياقِها (كأن نُحَدَّدَ دلالة 


كلمة "عَين» على الجارحة أو الجاسوس أو بر الماء)؛ وقد أولَينا آليّة التُحليل الذَّلاليٌ أهريّة 
خاصّة - في مواضع مُتَفرّقة من فُصُول هذا الكتاب - نظرًا لأهمّيتها مع أنها الأقل انجارًا. 


وتجْددٌ الإشارة إلى أن التحليل الدّلاق له العديد من الدّرجات الفرعئة مكل: 


فك الالتباس اللاي للكلمة (([11775 - 02قناع أطمته015[ عكدمعة 11/010). 
ومثال ذلك كلمة ١عين»‏ حيث تأتي بمعنى الجارحة. أو بثر الماء» أو الجاسوس... 
إلخ. وكمبحث فرعيّ لدلالة الكلمة: التَّعرّف على أساء الكائنات (0عةل< 
10 1801). ومن أمثلتها كلمة «القاهرة» الي تأي نعمًا وَّنثِ» أو 
عدا على مدينة القاهرة. 

فك التباس المشترك الأنفلة (26100ناى 1ط صتدد 1 2مطمدمك). ومن أمثلة 
ذلك: «أحيّت البنث أختها كثيرًا» فلا قابلتها جرت إليها». وموضع الالتباس 
أنّنا نجد صُعُوبة في معرفة مَن الذي جرى إلى مَنْء هل البنت إلى أختها؟ أم 
الأغيت إلى اليف ؟ وغوز أن تسمية «إزالة الاش الضيائر)»: 

تحليل الإلماحات (328130515 2/16105). ومثال ذلك «قابل هشام محمدًا» فقال 
له: «موعدنا غدًا يا هشام» فرد قائلا: «بل بعد غد). من قال ماذا؟ 

فك الالتباس البلاغى (1(153225181128100 011]ع1): ومثاله «رأيت أسودًا 
ف المعركةةء إذ القضد قرآيكٌ نوما #تجعاناة: 


الفصل بين الملوضوعات (5603186100 أعء[5110). ففي أحيان كثيرة تتناول 
المقالة أكثر من موضوع ولا نجدٌ بالضرورة عناوين فرعية للفصل بين 
الموضوعات الجزئية. نعم؛ يمكن أن يكون كل موضوع له فقرات منفصلة» 
ولكن عدد فقرات كل موضوع مختلف ولا يفصل بينها عنوان فرعيّ. فكيف 
يمكن أن نفصل بين الموضوعات الجحزئية؟ إن هذا الفصل يكون ضروريًا عند 
استرجاع المعلومات المفيدة؛ فلو أمكن الإشارة إلى موضع المعلومة المفيدة في 
المقالة أو الكتاب بشكل دقيق» فإن ذلك يوفر على الباحثين الكثير من الوقت. 


لات 


ا ا عزني اشاوان 
القوينة ملك حقنقًا ومقية :أذ ين نعل إل +10 :هه فزن :هذا الستوي يمد 
درجةً حسم ضعيفةً للغاية لكثير من الغايات المطلوبة من الحاسوب. 


ا١ره-‏ التَحليل ا محجمي (22215515 لي 

ويتم في هذا المستوى تعيين نْ مُكوّنات المحجم لوي وتوصيفهاء على النّحو الي 
يكن م التي بن مبافي اللّفة ومعانها ويجمعٌ هذا الُستوى بين مُستويات التّحليل 
اغوي السّابقة؛ حيث يعنى بالتُحليل الفونولوجي في معلومات تُطق الَرّدات؛ 
هذا اليس أهية خاصّة في المعاجم الو جيه لخو اناه اللّة؛ ويُعنى بالتّحليل الصَّرفيَ 
بهدف استخلاص الوحدات الأساسيّة للمُعجم [المباني]؛ ويُعنى بالتّحليل التَرَكيبيَ في 
الاستدلال على سياقات الُْمرّدات ومعانيها الوظيفيّة؛ ويُعنى كذلكٌ بالتّحليل الدَّلاليٌ 
في الاستدلال على المعاني المعجميّة. 

ما عن إشكاليّة التَّداخُل بين هذه المستويات. فنستَطِيعٌ أن تَتبيّها من خلال التّقاط 
التالية: 

* يتداخل مستوى التّحليل الفونولوجي مع مستوى التّحليل الضَّرقّ» حيث 
كوي ديك لاز إكان رعرع أن نج في تمتريات غيل تصرييها 
بين التحليل الفونولريتي والتّحليل الصَّرق. نجع وُجود ظاهرة الإعراب 
في العربيّة» إل أن أهلّها - عادةً - يهملون تشكيل حُرُوفها بعلامات الضَبط 
(الحركات القصيرة والسَّدَّة والتّنوين) - باستثناء حالة التّنوين بالفتح؛ 
ولاحظ أنَّ التُشكيل لا يُزِيلُ لبس الصرف تماماء وإنَّا يُرِيلُه الحسمٌ الصّرفّ. 
ومثال ذلك: كلمة «قال» بعد تشكيلها يظل الالتباس قائاء هل هي من جذر 
١ق‏ ول» من القول» أم من جذر «ق ي ل» من «النوم وقت القيلولة». إذن يجوز 
أن نقول بلغة أهل الرياضيّات: إن إزالة الالتباس الفونولوجي شرط ضروريٌ 
ولكنه غير كاف لإزالة الالتباس الصرفي؛ مع العلم بأن التحليل الفونولوجي 
معني أيضًا بمسائل لها علاقة بنطق الكلمات؛ ويدخل في مباحثه الحروف غير 
المنطوقة والحروف المدغمة وما يحدث في حالات التقاء الساكنين... إلخ. 
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هذه الطبعة إهداء من المركز 
ولا يسمح بنشرها ورقيا أو تداولها تجاريا 
:ا ييا 


وكمثال للحروف غير المنطوقة؛ الألف بعد الواو في #تخرجواة؛ فإن الألف لا 
تنطق دوطال للعهرو نامدقي لام التَعريف في «الشّجرة»؛ حيث تُدعَم اللام 
ف العين» وتقذه الشين بالعال, 

* يتداخل مستوى التّحليل الفونولوجي مع مستوى التّحليل التحويّ» ونلاحظ 
هذا في الارتباط الوثيق بين التشكيل الكامل للكلمة العربيّة والتٌوصِيف 
الإعرابيّ النّاتج عن التّحليل التّحويّ للجُملة. 

لع ع ا ل 0 

إلا آنا ندعو - عند التَعامّل مع اللّغة العربيّة - إلى الرّبط بين هذين المستويين رياضيًا 
أن الأصل في النحو أن يكونٌ فرع المعنى. 


؟- التحدّيات الَنَى تواجه تقنيات الذّغات الإنسائية 

الله أمانة عظلة» ومقدرة الأساة فماغير قارلة للتغليد أو المساكاة: افإذا جلسك 
مع أخيك أو جارك وتسامرت معه لساعات طويلة فلا تكاد تمر - عبر آلاف الكلمات 
المتدفقة من فمه - كلمة لا تفهمها. فنسبة ما تفهمه إذا لم يكن 7/٠٠١١‏ فإنه يتجاوز 
11خ . بين) أفضل أنظمة التعرف على الكلام في الكلام التلقائي (كا ني الاجتماعات) 
قد لا تتجاوز »:/1١‏ وقد تزداد إذا كان الكلام منتظم) (كم) في نشرات الأخبار)؛ فقد 
تصل في هذه الحالة إلى أكثر من /4٠‏ بقليل). فإذا قارنًا بين 9 , 49/ وبين /4٠‏ وجدنا 
للوهلة الأولى أن هذا شيء عظيم جدًا وأنه لم يبق إلا القليل. وفي الحقيقة يتطلب تحقيق 
باستخدام الآلة سنوات من البحث والعملء وقد لا ندرك بعد سنين طويلة من 
الأبحاث إلا زيادة /١‏ أو 7/. 

أريدك أن تقارن بين نسبة الخطأ عند الإنسان وعند الآلة» فنسبة أخطاء فهم الكلام 
عند الإنسان في نفس الظروف أقل من ١‏ و 2/٠‏ أي أقل من كلمة من كل ٠٠١١‏ كلمة» 
بين| يخطئ الحاسوب في فهم كلمة من كل ٠١‏ أو في أحسن الأحوال ٠١‏ كلمة. لو أن 
الجملة العربية تحتوي على ٠١‏ كلمة فإن الحاسوب سيخطئ في المتوسط في كلمة أو 
كلمتين في كل جملة وربم|ا تكون هذه هي أهم كلمة في الجملة» أو ربما تعرف على الكلمة 
بكلمة أخرى تغير المعنى وتبدله. 


لالاد 


الذي أود توضيحه أننا معذورون في عدم قدرتنا على اللحاق بمقدرة الإنسان ولو 
بعد حين. 

في عام ١٠٠٠م,‏ في أحد المؤتمرات الدولية لأبحاث وتقنيات الصوت (-1016 
ناآ -اناطصة15 ,2000 ناءءوم9), سأل أحد مدراء المؤتمر في ختامه سؤالاً مفتوحًا 
وطلب من الحضور الإجابة؛ هل بعد ١6‏ سنة من ذلك الوقت يمكن أن نعتمد على 
الحاسوب في فهم الكلام فهمً) يجعل الإنسان يعتمد عليه كليًا؟ وكانَ إجماع شيوخ العلم 
وأساطينه باستحالة ذلك. فقد انقطع أمل العلماء الذين قضوا 0٠‏ سنة أو تزيد في تقنيات 
الصوت في الوصول إلى شيء يقارب الإنسان» ولكن لم ينقطع الأمل في إنجاز مهام 
محددة» لكلماتٍ محدودة في مجحالات تخصصية محددة؛ بحيث نخاطب الآلة (الحاسوب أو 
النَقّال) في جو هادئ وبشكل مننظم وبلغة صحيحة؛ أما أن نتعامل مع الآلة كما نتعامل 
مع بعضنا بعضًاء فهذا على قدر علمنا في هذا الزمن من المحال | ولعل الله الذي تكرم 
بالبيان يتكرم بالعلم الذي يمكن الإنسان أكثر وأكثر. 

حين قارن العلماء بين ما تم إنفاقه على أبحاث التعرف على الكلام وما تم إنفاقه على 
أبحاث الأشعة في الطب في الثانينيات من القرن العشرين» كان الإنفاق على الأبحاث 
متقاربًا وكانت النتائج أيضًا متقاربة» إذ قاربت النتائج في الحالتين /4٠‏ كنسبة نجاح. 
ولكن شتان بين التأثيرين؛ ففى مجال الطب لا تكاد تجد مستشفى ولا مستوصفا إلا فيه 
جهاز أو أكثر للأشعة» ولق الخال كذلك بالنسبة للكلام» لأن 4 هي بداية الرضا 
الحقيقي» وما دون ذلك يصعب انتشاره وقبوله؛ ناهيك عن ./41١‏ 

والسبب - كما ذكرنا سالقًا - أننا نملك أجهزة نطق وتحليل للكلام غير قابلة 
للمقارنة» فمن العسير جدا مضاهاة أذن الإنسان» حتتى 44/ مها عدد من الأخطاء أكثر 
بعشر مرات من نسبته عند الإنسان (4 ,44 /7)» والتي تكاد تكون مرجع قدرة الإنسان 
الراقية جدا في هذا المجال. سبحان من خلق فسوّى وَقَدَرَ فهدى. 

ومع أننا استعرضنا في هذا الفصل تقنية التعرف على الكلام مع مقارنة قدرة 
الحاسوب مع قدرة الإنسان فإن كثيرًا من التقنيات يتفاوت رضا الإنسان عنه. بين أن 
يكون كاملاً أو ما يقارب الوضع مع تقنية التعرف على الكلام. 
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"- التحدّيات التى تُواجه معالحة اللغة العربية 
للّغة العربيّة العديد من السّمات التي ميُرّهاء ومع أنَّ هذه السّمات قد تمل عناصِر 
ُو لهاء إلا أنّها مُكل في الوقت ذاته عناصر تحدٌ إذا ما أردنا إخضاعها للحوسبة. 


وسئوردٌُ في هذا المحور بعضّ التّحدّيات التي تُواجهّنا عند إخضاع العرييّة للمُعاكَة 
اللناسوية -من خلال الثقاط الثالية» 


-١ , “‏ الكتابة العربية 
* الكتابة العربية لا تُفهم إلا إذا كانت حروفها متصلة» كا في هذا الكتاب: 


هفاك يعن تروف النى الاين الاتصال» إة بيعها وين تهجاورافيا من 
اروف في نفس الكلمة مسافة قصيرة نسبيًا. والواقمٌ أنَّ فصل الكلمات 
بعضها عن بعض مسألة ليست بسيطة. ففي أنظمة تجارية لبرامج التعرف 
غل الخروف العرية تج أن فحية قارب اهن الأغطاء هل حشري 
الكليات» يكون أصل الخطأ فيها خطأ فى فصل الكليات يعضها عن بعضن» 
هذا اذا كانت الوقيقة واضطة. 

الكلمة العربية - والتي يجب أن تكتب فيها الكثير من الحروف متصلة 
ببعضها خ رقمل سالة التعرف على حروف هذه الكلمات مسألة أكثر 
صعوبة من التعرف على النصوص المكتوبة في اللغات اللاتينية» حيث يمكن 
أن تكتب جميع حروفها بطريقة مُنفصلة عن بعضها البعض (وهو الغالب في 
الطباعة). وذلك يضيف تحديًا آخر أمام تقنية تحويل الكلام العربي المطبوع 
إلى نصوص مقروءة. وسوف نتعرف على ذلك بالتفصيل في الباب الخامس 
عشر من هذا الكتاب. 


٠‏ أساء الأعلام والكائنات (وه انام لعمسول2) لا غير في اللغة العربية» بينا 
في بعض اللغات تميز بحروف كبيرة في الرسم (155عااع1 1121مة0). مثال ذلك 
«زرت القاهرة» مقابلها (08310) 7151660 1356 1). فإن وجود هذه العلامة 
الإضافية في الكتابة ترفع نسبة التعرف على أسراء الكائنات ليا (#وكنام8 مسدلا 
03 62 وهذه كثيرًا ما تستدعي في مجال محركات البحث. إذ لا يكون 


دا فب 


الاستفسار عن الكلمات العادية» ولكن عن مُكوّنات اسميّة سواء أكانت 
أشخاصا أم أحداثا آم مؤسسات....إلخ. 


؟ غياب التشكيل عند بنية الكلمة أو نهايتها. فقد اعتادٌ العرب في مُعظّم كتاباتهم 
عدم وجود تشكيل على الخروف. وإذا وجد (ربا في /٠١‏ من الكتب) يكون 
تشكيلاً جزئيًا لبيان الفعل المبني للمجهول من الفعل المبني للمعلوم مثلآء أو 
لبيان التشديد في الكلمات التي يغير فيها التشديد المعني... إلخ. وهذا يدع لنا 
الكلمة العربية من وجهة النظر الحاسوبية لغرًا كبيرًا؛ فكلمة مثل عين يمكن أن 
تكون:- عَيْن أو عَيّنَ أو عَيّنَ ..الخ. التشكيل في الحقيقة يمثل جزءً ضروريًا من 
حقيقة الكلمة العربية» إذ إنه يمثل الحركات القصيرة (5120117077:615). والتى 
عادة ما تكب في لخات أخرى كالإنجليزية والفرنسية»... إلخ: إذ يرك للقاز 
العربي استنباط مالم يكتب من هذه الحركات أو التشديد أو التنوين لبداهته» 
وإذا كان العقل البشري قادرًا على الحسم بيسر وسهولة في قريب من /١٠٠١١‏ 
من الحالات, فإن الأمر بالنسبة للحاسوب ليس بنفس السهولة. 
هذا الأمر يسهل الكتابة العربية؛ فمتوسط عدد حروف الكلمة العربية المكتوبة يزيد 
قليلا من ؛ حروف؛ بين يزيد الأمر في الإنجليزية مثلاً عن ذلك كثيرًا (نظرا لكتابة 
كل شيء تقريباء باستثناء «الكلمات الوظيفيّة 70105 1102ءصلة»)» ولكنه يزيد دائرة 
الالتباس عند الحاسوب ويجعل المعالجة الحاسوبية ذات أبعاد أكثر من مثيلاتها في بعض 
الذحات اللاتعة ومن عم ة اله أن اتيكت الكناء الغرنةة فرط فلو بفتت ار 
العَربيّة دون تنقيط لأصبَحت مُهمّةٌ الحاسوب شبة مُستّحيلة. 


, 7- الأخطاء الشائعة 


كقزة فوكلاللغاك رلكن :للع الغو اكنال عا لفلف سيت ل زيادة 
نسبة هذه الأخطاءء منها: 


* المحمزات» خاصة مع الألف (اء أ !)؛ فنسبة الأخطاء فيها عالية بين عامة الناس. 
* الحاء والتاء المربوطتان؛ مثال «القاهرة» كثيرًا ما تُكتب «القاهره» والعكس 
«ضربه) يمكن أن تكتب (ضرية). 
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هذه الطبعة إهداء من المركز 
ولا يسمح بنشرها ورقيا أو تداولها تجاريا 
ا:6ا6ا6ا ب ييا 


٠‏ قد لاايكون خطأ ولكن اعتاد أهل مصر مثلا عدم استعمال الياء آخر الكلمة 


منقوطة لتمييزها عن الألف المقصورة ى) في «على) و «١علي).‏ 

هذه الأخطاء الشائعة تضيف للالتباس تحديّا آخرء إذ إن أيّ نظام لتحليل النص 
العربي الخام مثلا أو التشكيل يتطلب - لكي يكون مقبولا عمليًا - التعامل مع 
النصوص العربية المرتبكة في همزاتها أو هائها وتائها أو يائها وألفها المقصورة. 
نظرًا لدخول الثقافة الأجنبية بشدة وشيوع الكتابة بهاء فإن كثيرًا من النصوص 
المطلوب التعامل معها على الإنترنت مكتوبة بالحروف اللاتينية. ومثال ذلك: 
(2:37 عااعطهط 322 12201) ويقصد الكاتب: «أبى أنا أحبك كثيرًا». 

نظرًا لإهمال التعامل بالعربيّة في المرحلة الجامعية في معظم الجامعات العربيّة 
نجد الكثيرين من خريجي الجامعات تختلط العامية في كتاباتهم بالعربية مثال: 
«معلهش أنا كنت فاكر إني هاقدر أجي امبارح ...). 


وأحيانًا نجد أننا نود معرفة آرائهم وأفكارهم فنجد أنه لا بد من محاولة ترجمة مقالاتهم 


كما هي إلى العربية الفصحى الحديثة (2/154 -473016 51220310 جزع3/100) . 
الأخطاء الإملائيّة الشّائعة» مثل: 

شَّيْء ->(شيى - شيىع). 

إن شاء الله > (إنشاء الله). 

لات جه (لابد): 

ناهيك عن أخطاء المجاء الأخرى» كمن يستعمل الحروف القريبة في النطق 
فيكتب: 

مظاهر -> مضاهر (وهو خلط شائع في الجزيرة العربية والمغرب العربي). 
ذليل -> زليل. 

وسيط -> وصيط ... إلخ. 


إلا أن هذا النّوعَ منتشر في كل اللغات الإنسانيّة ويكثر بين متعلمي العربية كلغة 


ثانية. 


ات 


”و - التركيب الصرفي للكلمة العربية 

الكلمة العربية مركبة تركيبًا عميقًا مما يجعلها من اللغات ذات المفردات الكثيرة 
(ع13551128 طاءع1 7إ16211ع2010م:220) مقارنة بالإنجليز ية مثلاً وسوف نعرض 
في فصول الكتاب لتركيب الكلمة العربية. ولكن ما همنا هنا الإشارة إلى 
حقيقة عدد الكلمات العربية والتي يمكن أن تكون بالملايين» ومع أن الكلمة 
العربية تتكون من عدد محدود جدا من الوحدات المعجّميّة (8عمرعءه.]) (-- ١٠.٠.ه‏ 
جذرء -- ٠٠١‏ وزن (عدا ما يتفرع منها نتيجة الاعتلال)» -- 7٠٠١‏ سابق و-- 05٠‏ 
لاحق). وهذا في مجموعه لا يتجاوز ٠٠٠١‏ وحلدة معجَمِية (065اع<ه.1)». فهذه 
ميزة كبيرة جدًا ل تستفد منها كثير من التقنيات بالقدر الكافي بعد. وما الصعوبة التي 
يشكلها العدد الكبير من الكلمات في اللغة؟ على سبيل المثال: التعرف على الكلام» هذه 
التقنية تتأثر نتائجها بعدد الكلمات التي تتعامل معها في أي مهمة من مهام هذه التقنية. 
وللعلم؛ فإنه في مجال الأعمال يكفي في الإنجليزية نحو 54 ألف كلمة لتغطي 49/ 
من احتياج المتحدث بينا يحتاج العربي إلى أكثر من ٠٠١‏ ألف كلمة ليغطي 44/ من 
احتياجاته في نفس المجال. 


“, 4 - تركيب الجملة العربية 

؟ تسمح اللغة العربية بالتقديم والتأخير بين كلاتهاء ولهذه الظاهرة دلالات 
بلاغية وقيمة رائعة. فمثال ذلك: قوله تعالى #إإِيّاكَ تَعْبّدٌ وَإِيّاكَ مَسْتَعِينْ 4 
[الفاتحة ]. حيث يُفِيدُ تقديم (إياك» على «نعبد» الحصر والقصر. وحين يقول 
ربّنا - سبحانه وتعالى #يُرِيدُ الله بكم اليّسْر» [البقرة 185]. #الله يُرِيدٌ أن 
يتوبّ عليكم4 [النّساء 717]؛ فقد اختلقّت دلالة التّقديم والتأخير بين الفعل 
والفاعل من آبةٍ إلى أخرى. 
ولكن ما تأثير ذلك على الحوسبة اللغوية؟ إنه يزيد من صعوبة المعالجة النحوية 
والبلاغية للعربية مقارنة بالإنجليزية مثلء وفي نفس الوقت ل يقدم لنا اللغويون 
مجموعة متكاملة من القواعد التي تحيط بالموضوع وتحسمه إذ إن كثيرًا من الحسم 
يعتمد على الجانب الدلالي» على اعتبار أن النحو فرع المعنى. 


-/اا بت 
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ولا يسمح بنشرها ورقيا أو تداولها تجاريا 
:ا ييا 


ولا بد من صياغة القواعد اللغوية بطريقة يمكن الاستفادة منها حاسويًا. 
ونضرب لذلك مثالاً: 

تتبع الصفة الملوصوف في العدد والجنس والتعريف (مع وجود أنواع أخرى 
للصفة). وعليه» فالقياس الحاسوبي للعدد والجدس والتعريف تمكن» وبذلك 
تنجح هذه القاعدة في البرمجة الحاسوبية. بين) إذا قلنا إن الخبر هو الذي يُتمُ 
معنى المبتدأ فإننا ربطنا الحسم النحوي بالدلالة وضاع طريق الحسم 
من تحت أقدامنا. إذ إن الدلالة أعلى في سلم الحسم اللغوي من النحو. 

غياب بعض الكلمات تمامًا مع وجودها التقديري: ومثال ذلك أنك تتحدث 
عن «زيد) من الناس ثم تقول: (ودخل إلى الحديقة). أين الفاعل الذي دخل؟ 
تقول إنه لضمير مستتر تقديره هو. قد تكون هذه الظاهرة منتشرة في لغات 
أخرى بيد أنها تزيد التحدي أمام المعالجحة الآلية. 

ينعن أنيقيةة لقعا عن الخيلة الغرية عله وفصيلة وشبين خلة اسن 
بين| الجملة الإنجليزية لا بد من وجود فعل بهاء وإن اقتضى الأمر استخدم فعل 
مساعد: (ع6 10 طتلع7؟ : انوع 1131537 كتللة) . 

«الجو جميل» المقابل ها بالإنجليزية الاكتانتهءط 15 تتعطندء:؟7 ع1 )) . 


إن ذلك يرفع العربية درجة في مرونة استخدامها ويجعلها أرفع وأيسر في 
الاستخدام البشري» ولكنه يوسع دائرة الخيارات غير المحسومة أمامنا عند 
إخضاع الآلة لهذا العمل. 

ومن التحديات التي تواجهنا أن كاتب العربية يستطيع أن يربط بين جملتين 
بحرف الواوء إذ إن كتابته أسهل عليه من كتابة فاصلة أو نقطة؛ لذلك فمتوسط 
طول الجملة العربية أكبر بكثير من متوسط طول الجملة الإنجليزية. وماذا 
يشكل هذا بالنسبة لحوسبة اللغة؟ 
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إن طول الجملة يصعب على الحاسوب فهمها فهً) دقيقا. خذ هذا المثال؛ لو أن تقنية 
وصلت لدقة 4٠‏ في المتوسط لمعالحة كل كلمة على حدة» ستكون نسبة الدقة 
'" التي لحملة من: 
- كلمتينء دقة الجملة > (دقة الكلمة)؟ //1١-5)/950(-‏ 
- هكلاتء دقة الجملة - (دقة الكلمة)ه ”*)/9٠(-‏ -059/ 
٠٠١ -‏ كلمة» دقة الجملة - (دقة الكلمة) ٠,٠٠5! - ٠٠١‏ / أي تقريبًا 


*, ه- التعامل مع الواقع اللغوي 

فالعربيّة تّعاني تراجُعًا كبيرًا في السنوات العشرين الأخيرة. وبالتحديد بعد 
انتشار الإنترنت وزيادة نسبة التعليم باللغات الأجنبية في مراحل التعليم قبل الجامعي؛ 
فنحن الآن أمام ظواهر لغوية خطيرة ت#هدد مستقبل العربية في أرضها. فا الموقف من 
العامية والكتابة بالحروف اللاتينية؟ 

٠.‏ الجاين الا ار أل الح الوك حراج عطي تيعو لمشت 
على الأقل فهًا وكتابة. بمعنى أنَّنا لا نريد أن تنتشر أي قواعد للكتابة والقراءة 
إلا قواعد الفصحى. 

* إذا كانت هناك بعض اللهجات. فإننا ندعو إلى التّقريب بينها؛ وربما يجعل عالم 
الإنترنت ذلك ممكنا. ولكن ك] سمح الله تعال بلارة كتانه يقراداك خيلعة 
لاختلاف اللهجات. فإِنْ علينا أن نقبلَ بوُجود لحجاتٍ مُتلفة» ولكن. ليك 
ذلك في القراءة دون الكتابة. فمثلاً أبحاث نطق النصوص العربية (18010:ه 
اءءءم5 16410) لا بد أن تنطق النصوص بالفصحى لا العامية؛ والفصحى 
يفهمها عامة العرب» وذلك لأن نشرات الأخبار في معظم القنوات تنطق 
بالفصحى (حتى مع بعض الأخطاء). 


-١‏ يمكن تحديد دقّة الجّملة من خلال نسبة الجمل الى تكون جميع كلم|تها صحيحة. 
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:ا ل ييا 


أما بالنسبة للتعرف على الكلام من العامة فإننا نجد لزامًا على الباحثين أن 
قد يكون مهما لخدمة عامة الناس في شؤون حياتهم المختلفة. 


3 2 
5 - التعريف بتقنيات اللغات الإنسانيّة 
كان للتّعدّم المعلوماق الذي شهده العام في العُقود الأخيرة أثرٌ كب في تطوير أدوات 
مُعاجَة الّغات الحيّة وتنمية تطبيقاتها اْتي تزداذُ يومًا بعد يوم . وتتفاوت درجات العناية 
بالتقنيات المستخدمة في بناء وتطوير هذه الأدوات بحسب الحاجة إليها ؛ كما تتنوعٌ هذه 


لتّييات بتنوع بيئات العمل فيها . وفي ضوء هذاء يُمكن تقسيمٌ تقنيات اللّغات الحيّة إلى 
الأقسام المضّحة في الشّكل .)1-١(‏ 


البحث في النُصُوص || التَّعيُف الآ على الكلام إألتَّجُف على الكتابة المطبوعتلا ‏ تقنية قراءة الكتّب 

الإجابة الآليّة عن الأسئلة انكف 17م سكف على اروف |[ الاستجابة الصّوتيّة التَفَاعْايّة 
7 7 .نه أعلة» لغة شارة ل 
هك تج 1 تا عن 

!7 وم 
5 الأنظمة المتَعَدّمة لاسترجا 
0 


التقيب عن الآراء 


القياس الأسلويّ 


الشّكل :1-١‏ من تقنيات اللغات الإنسانيّة 


وذ 


وستجاول داقا يله أنانعز قت بإفاردظده القيات فل اشر لفميل 
الحديث في المشهور منها في فُصُول الكتاب اللاحقة. 

١5‏ -البحث فى النصوص «محركات البحث) (وعمتعص! طعنيدء5) 

تعد محركات البحث في النصوص أو الوثائق من أكثر التقنيات استخداماء والغرض 
منها استخراج المعلومات المطلوبة للمستخدم؛ ولعل المحرّكات الأكثر استخداما في 
الوقت الحالي هي تلك التي تُعنى بالبحث عن الوثائق التي تحتوى على كلمات بعينها 
وتسمى الكلمات المفتاحية. ويمكن تقسيم محركات البحث إلى عدة أنواع» منها: 

* مُرّكات البحث في الوثائق الشّخْصِيّة على الحاسوب الشخصي. 

٠»‏ محرّكات البحث في الوثائق المؤسسيّة (ادمدء؟ عكتدممعام8). 

* ُحرّكات البحث في الوثائق الشَّبكيّة (البحث عن وثائق الإنترنت) (66 


طعنوء 5) . 
ويمكن تقسيمها من حيث نوع النصوص إلى: 
؟» بحث عام. 


وبحث في مجال متخصص. مثل الطب. والقانون»....إلخ. 

وتجدر الإشارة إلى أن البحث في المجالات المتخصصة يحتاج إلى ما يُسَمّى بالبحث 
الدلالى أو البحث الأنطولوجى» ويساعد هذا البحث على دقة وسرعة الوصول 
العملرية دوعل مبااع مدال لو أردنا آنا عدت عق كله ورهن ان تأ بالوكاقق 
التي تتحدث عن الأسود. أو النموره أو الضباع.... إلخ. فهذا يعد قصورا في البحث» 
مالم ندعم محركات البحث بمعلومات دلالية لكل كلمة؛ ولا يزال البحث الذَّلاليّ 
قاصرًا ونادرًا في اللغة العربيّة. 

كا ظهر - حديثًا - نوع من البحث؛ يتجاوز النصوص إلى الوسائط المختّلفة 
الأخرى. مثل: 

* البحث في ملفات الصوت. 


امد 
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:ا ييا 


* البحث في ملفات المرئيّات. 


5 ال حمة الآليّة (صه60ماكصة :ا عستطعد1ة8) 

تعد الترجمة الآلية من التقنيات المهمة» والتى تضاعفت قيمتها بعد ظهور الإنترنت 
ودعت الحاجة للتواصل بلغات مختلفة أو للاستفادة من كنوز معرفية هائلة ولكن 
بلغات أخرى. وللترجمة الآلية مدارس عدة منها: 

* مدرسة الترحمة بقواعد وقواميس ثنائتية اللغة. 

؟ مدرسة الترجمة بالاعتاد على مدونة ثنائية اللغة» حيث يوجد في هذا النوع من 
المدوّنات ما يكفي من معلومات لتعليم نماذج رياضية. وهناك طريقتان لهذه 
المدرسة: 
- طريقة التعلم من الأمثلة؛ وتستخدم إذا قلّ حجمٌ المدونة الثناتيّة اللغة. 
- طريقة الترحمة الآلية الإحصائية (9600[قصهآ” عصنطعة11 21ع156هة51)؛ 

وهذه تحتاج لمدونات كبيرة جدا قد تصل إلى عدة ملايين من الجمل لكي 
تعطي نتائج ملموسة. وتعد هذه الطريقة هي الأكثر شيوعا بين العاملين في 
حقل الترجمة حديثا. 

* مدرسة الترجمة عبر لغة وسيطة» وقد حدث تطور في هذه المدرسة أيضا وها 
بعض الإنجاز الجدير بالمراجعة والاستفادة منه. وقد خصص باب كامل 
لدراسة هذا الموضوع بالتفصيل في الجزء الثاني من الكتاب. 

وقد استخدم علماء هذا التخصص عدة وسائل لقياس جودة الترجمة الآلية؛ لعلّ 

أشهرها ما يُعرَفٌ ب: مُقَيّم «بلوا أو (©:500 [131:51) حيث يسجل الإنسان - إذا قامَ 
بالدَرّجمة بنفيه- أرقاما تصل إلى +80/ على هذا المقياس» بين| تسجل أفضل محركات 
الترجمة الآليّة من اللغة العربية للإنجليزية ./0٠0-‏ ولازال التقدم متلاحقاء والاهتمام 
العلمي في تزايّد لتحقيق هدف البشرية في تحقيق التواصل بين البشر وتوسعة الاستفادة 
من معارفهم المختلقة للخات: وتتيح تحركات الترجمة الآلية الترجمة من وإل العديذ من 


مما 


لغات العالم. وعلى سبيل المثال: يتيح محرك الترجمة الآلية في جوجل الترجمة بين أكثر من 

5 و ”1- الإجابة الآلية عن الأسئلة (وست نص دمناوءن ©) 

تعد الوسيلة الأولى لاكتساب المعرفة هى السؤال في صيغة اللغة الإنسانية التى 
فطلاتها الإشان» والطلوت تيل السغال وفهم المزاد والبخك»عن"الإنجابات بين 
الوثائق المتاحة على الإنترنت أو في قواعد بيانات مؤسسة من المؤسساتء ثم عمل 
استخلاص للمعلومات بشكل كافٍ للإجابة عن السؤال ثم وضع هذه الإجابة في 
صيغة لغة السائل الإنسانية. وهذه طريقة مركبة وتحتاج إلى عدد من التقنيات للوصول 
بالإجابة إلى درجة الدّقة المناسبة. ومثل الكثير من تقنيات اللغات الإنسانية» فإن هذه 
التقنية المركبة لا تزال تحتاج إلى مزيد من الجهد وخاصة للغة العربية. ولا تتجاوز 
الأسئلة - في أكثر الأنظمة الخاصّة مبذه التقنية - نطاقًا محدودًا من المعارف. 


5و5- التّقييم الآلي للمقال (عسترمءك5 نجدو15 222660مه]سه) 

نظرًا لصٌعوبة تقييم الامتحانات والواجبات في مراحل التّعليم المختلفة على 
القائمين بباء فقد ظهرت أناطٌ جديدةٌ من الأسئلة التي يستطيع الحاسوب أن يتعامل 
معها بسهولة» وهى الأسثئلة التى لها إجابات محدّدة (مثل: الاختيار من متعدد تعيين 
الصّواب والخطأء 7 التراغات: وغير ذلك). ومن السّهل إخضاع الحاسوب لتقييم 
هذا النّوع من الأسئلة بعد إمداده بالإجابات الصّحيحة للأسئلة المدرّجة.. 

إلا أن هذه الأنناط من الأسئلة لا تختبرٌ مهارات التعبير عند الطلاب؛ لهذا.. ظهرت 
الحاجة إلى تطوير تقنية يمكنها التعامل مع الإجابات الإنشائيّة (كموضوعات التعبير 
وما شاببّها من أشكال الكتابة الإنشائِيّة)؛ وظهرت بالفعل العديد من الامتحانات 
الدّولية الي تُفِيدٌ من هذه التقنية. 

وتقومٌ فكرة التقنية - عمومًا - على اختيار نباذج وعينات من أشكال الإجابة 
الإنشائيّة (الجيّدة والمتوسّطة والرّدِيئَة) وتصنيفها بحسب درجة التّقييم وأخذ ملامحها 
والاحتفاظ بهاء نّم تعيين الملامح الَّني مير الإجابات الجديدة تمهيدًا لقياس درجة اقتراب 
الإجابة الجديدة من الإجابات المدرّجة في نظام التّقييم. وتكمن الصّعُوبة الحقيقيّة في 


0 


هذه الطبعة إهداء من المركز 
ولا يسمح بنشرها ورقيا أو تداولها تجاريا 
بر 6ط طغسسسييا 


كيفيّة تعيين الملامح المميزة للإجابات الحديدة وطريقة ة قياسها بإجابات النظام. 


5.ه- التلخيص 9 للحيو ص (122112211012قللنا5 ألاءا عتأقساماسة) 

دعت الحاجة العملية إلى هذه التقنية وتزايدت بعد الانفجار المعرفي الحالي والمنتظر 
زيادته مستقبلا. فإذا أمكن التعرف على أهم ما ورد في ورقة بحثية أو كتاب في موضوع 
ماء قبل استقطاع وقت كبير لقراءته بالكامل؛ فربم| يفي الجزء المركز والمختصر بالغرض 
أو يقنع المستخدم لهذه التقنية بقراءة البحث أو الكتاب كاملا لبلوغ الهدف. 

ولهذه التقنية طريقتان: 

٠‏ لع يقة الأو : الاستخلاص (181118011002)». وتعتمد على انتقاء الجحمل الأهم 

من الوثيقة 5-57 
٠‏ العطريقة الأخرى: التلخيص (45]361100)» وتعتمد على صياغة جديدة 
مختصرة لنفس المفاهيم. 

والطّريقة الأولى هي الأكثر شيوعًا واستخدامًا بعالك ينه ة الأخرى فإن نجاحاتها في 
نطاقات محددة» ويزداد الاعتاد عليها كلما تقدمت ناذج فهم اللغات الإنسانية. ويدعو 
الطموح والحاجة العلمية والثقافية لدى الإنسان إلى الرّغبة في أن يتمكن يوما ما من 
تلخيص مجموعة من الوثائق في مجال معين وبعض هذه الوثائق بلغات أخرى» بحيث 
3 تقوم محركات التلخيص بتلخيصها جميعا ووضع الخلاصة في بضعة أسطر أو صفحات 
للمستخدم . لااشك أن هذا أمل يضاعف من استفادة البعرمن عيطات المعارف الحديثة 
ويزيد من إنجازهم؛ ولكن تحقيقه يحتاج لجهود كبيرة جدًا لنتمكّن من الاقتراب منه. 
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واخلاصة: 

أنه لا أحد تملك الحق 
١‏ 11535 | اند اد نسن” 

وكل بنى آدم خطاء ... 


و سس ع1 


الشّكل :"-١‏ التلخيص الآ للنصُوص 


ع 


5 و"- تصنيف وتجميع الوثائق 

(25ألاء]115) ع 1255152)1082) أساعستهه12) 

عند استخدام محركات البحث للوصول إلى وثائق مهمة فإن الإنسان يحتاج إلى 

الوثائق المشابهة لما اختاره. وذلك يمكن أن يتم بطريقتين: 
تصنيف الوثائق آليا (0135516686100 606<نتاه120): حيث يكون هناك 

تقسيم مسبق للوثائق (كأن تقسم إلى سياسة واقتصاد...الخ) وهناك تصنيفات 
متعارف عليها لدى علم المكتبات» وكذلك تصنيفات فرعية لهذه التصنيفات. 
تقسيم مسبق للوثائق. ونُسِتَخْدَّم هذه الطّريقة إذا كانت لدينا مجموعة من 
النصوص أو الوثائق وأردنا عمل تجميعات لأنواع الوثائق المتشابهة. 

وال هدف في الحالتين أن نصل إلى الوثائق المتشابهة. ويتمٌ تصنيف الوثائق وتجميعها 


البريد 00 
وثائق عي 


"0 تجميع الوثائق الآلي (4عتتتناء100 عستتع :015 ): وفي هذه الحالة ليس لدينا 


الوثيقة 1 
الوثيقة 2 


الوثيقة ن 


الشّكل :5-١‏ تصنيف وتجميع الوثائق. 
8 5 5 5 و 5 تلم امةا وو 5 
في حالة التصنيف الالي: تؤخذ ملامح كل وثيقة ونخدد خصائصها (في شكل 
رياضي) ويتم حساب درجة قرب أو بعد الوثائق من بعضها البعض حسب الملامح» 


هما _- 


هذه الطبعة إهداء من المركز 
ولا يسمح بنشرها ورقيا أو تداولها تجاريا 
:ا ييا 


ويتم حساب المسافة بين الوثيقة المراد تصنيفها والوثائق المصنفة سلفا (سياسة» 
اقتصاد.... إلخ)» فإلى أي قسم كانت الوثيقة أقرب تصنف على هذا القسم. 

وني حالة تجميع النصوص آليّا إلى مجموعات: يتم حساب قرب الوثائق كلها من 
بعضها البعضء وكل مجموعة منهم تقاربت ملامحها يتم ضمها في مجموعة مستقلة. 

؛ و /ا- التّنقيب عن الآراء (هسنهن31 صمنهنم©) 

من المهمٌ أن نتعرّفَ على اتجاهات الرأي على مستويات عدة؛ على المستوى السياسي 
لمعرفة ميول الناس إلى أي حزب أو فرد» وعلى المستوى الاقتصادي» كمعرفة رأي 
الناس في منتج جديدء إذ يكون مفيدا للشركة المنتجة أن تعرف رأى المستخدمين له. 
ولكن كيف سيتم تجميع هذه الآراء؟ تقليديا يعم عمل اشتبانات وتختار العيتة أو 
العينات بعناية لتمثل رأي القطاع المستهدف من الدراسة....إلخ. 

وتكون عملية اختيار العينة ثم إقناع أفرادها بملء هذه الاستبيانات مجهدة ومكلفة 
جدا. وأصبحت هناك مؤسسات متخصصة في هذا الأمر. ولكن بعد ظهور الإنترنت 
والمدونات (المقالات التي يسمح للآخرين بالتفاعل معها ووضع آرائهم) وشبكات 
التواصل الاجتماعى (2665011128 500131) التى يَعَيّر الناس فيها بحرية كاملة 
عن آرائهم» حتى في البلدان التي لا تكون فيها الحرية كاملة للناس» لأنه يمكن دائما 
استخدام أسماء مستعارة والهروب من الرقابة» أصبحت آراء الناس في كل شيء تقريبا 
متاحة وبكميات هائلة على الإنترنت. لذلك بدأت الحاجة لهذه التقنية والتى يكون من 
مكوناتها تجميع المواد ذات العلاقة بموضوع الرأي المراد معرفة اتجاهاته اختبار هذه 
الآراء والخروج باتجاهاتها. 

مثال: لو أن شركة سيارات أنتجت موديلاً جديدًا من السيارات وتريد معرفة آراء 
الناس فيه فبعد تجميع المواد المنشورة على الإنترنت حول هذا الموديل من السيارات 
يمكن للشركة معرفة رأي الناس في السعر والجودة وما يعجبهم وما لا يعجبهم من 
صفات وخصائص السيارة الجديدة» ويمكن هذه التقنية أن تستخدم وبشكل مستمر 
لإعطاء مطوري الأعمال في هذه الشركة معلومات قيمة يمكنهم من خلالها تحسين 
وتجويد منتجهم بشكل مستمر. 


5 


ويتم بعد تجميع المواد عمل تصنيف لالآراء حسب الكلمات المستخدمة. فكلمات 
مثل: (رائعة» وجميلة» ومدهشة....) تعبر عن آراء إيجابية» وكلمات مثل: (سيئة» غالية 
جداء...) تعبر عن آراء سلبية. طبعا هناك تعقيدات كثيرة للوصول الدقيق للآراء. 

فعلى سبيل المثال: ماذا لو كتب الناس (ليست سيئة» أو ليست جميلة)؛ فورود كلمة 
(جميلة) مسبوقة بالتَّي تقلب الإشارة الإيجابيّة في الكلمة إلى إشارة سلبيّة. كل ذلك 
يجب أن يؤخذ في الاعتبار. 


5 و 8- المدقق اللإملائ ئيّء والنحوي. والدلالي 

(لاععاععط) 225007 0 1م50 ,روستلاءمك) 

بعد ظهور الحاسوب الآلي الشخصي وانتشاره في الثانينيّات من القرن الماضي 

انتشرت برامج الكتابة عليه مثل: برنامج «©1/5-17/00» من كروبو وقد 
دَعَتَ الخاجة إلى -ظهور تقتيات: تكتشقف: الأخطاء الإملافية والنّحويّة والدّلاليّة في 
الوص وشاع فى كدر من الكجاة عل ضويب أن للكليات الخاطلة. 

وهناك عَدةطرق لإعداد هذه التقنية» منها: 

. ف تس ا ل يه 
الكلمة المكتوبة تتطابق مع إحدى كلمات القائمة فهذا ب يعني أنها صحيحة, وإلا 
فإنها كلمة خاطئة ومن ثم ننتقل للخطوة الثانية. 

* نبحث عن أقرب كلمات إلى الكلمة التي تبيّنَ خطأ كتابتها إملائياء فنحضر قائمة 
موجزة من عدد محدود من الكلمات» ثم يتم اختيار أقرب الكلمات باختبار 
السياق (مجموعة الكلمات في الجوار) وأيّها كان لها أعلى احتمال تم اختيارها بدلا 
من الكلمة الخطأ. 

والتقدم في تقنية عع الإملائي عالٍ ومُرضٍ الجة كس لك لامر لين 

بسيطًا داقًا؛ فاذا لو كيت كلمة صحيحة: لكنّها غير مطلوبة في السّياق؟ لو أراد 
الكاتب أن يقول : كَل ساعده فَكَتّبَ كَل ساعده».. تلاحظ أنَّ كلمة «قلّ» صحيحة 
إملائياء ولكنّها ليست صوابًا في السّياق. إِنَّ اكتشافّ هذا النَّوع من الأخطاء يكون أكثر 
صعوبة. ولكن لا يزال أمام تقنيتي المصحح النحوي والدلاللي بعض الوقت للنضج 


ا 


هذه الطبعة إهداء من المركز 
ولا يسمح بنشرها ورقيا أو تداولها تجاريا 
):َُا6ا ب ييا 


وعموم الاستخدام بالنسبة للغة العربية» على أن هناك مصححات نحوية متاحة للغات 


أخرى مثل الإنجليزية. المصحح الدلالي عموما أصعبهم ولم يصل لدرجة النضج 
الكافية بعد إلا في تخصصات محددة. 


4 و4- تعلّم الّغات بمساعدة الحاسوب 

(2181115ع بط 121151125 1060خ لاء ]نا مزحناه)) 

إن تعلم اللغات فرع من العلوم يحوز على أكثر من /7١‏ من الجهد التعليمي للتعليم 
قبل الجامعي» وينقسم تعلم اللغات إلى تعلم اللغة الأم وتعلم لغات أخرى كلغات 
ثانية» إذ إن أخطاء كل منها ومُشكلات تعلمه مختلفة. وعموما تتعامل تقنيات المساعدة 
في تعلم اللغات في اكتشاف وتصويب أخطاء: 

* الكتابة الإملائية. 


ا النحو وقواعده. 

* الدلالة (استخدام اللفظ المناسب في المكان المناسب). 

كا أن هناك تقنيات أخرى مفيدة في مجال تعلم اللغات لما علاقة بتصويب النطق 

وكما أسلفنا ني الحديث عن المصحح الإملائيء تُبنى التقنيات على مثل ذاك المنهج. 
والجدير بالذكر أن التعرف على أخطاء متعلمي العربية كلغة ثانية في الإملاء. 


ع مر 

5 و ١٠١-القياس‏ الأسلوي (تنعصره1ي5) 

ومن التطبيقات والتقنيات اللطيفة إمكانية التأكد من نسبة مقال أو كتاب لكاتب 
معين له كتب أو مقالات أخرىء أو ما يُطلّق عليه (القياس الأسلوبّ). والتقنية لا تعدو 
أن تكون فرعا من تصنيف الوثائق الذي أشرنا إليه آنفا. ويمكن الإفادة من هذه التقنية 
في القضايا التي تحتاج إلى توثيق نسبة مقال لكاتبه ى) يحدث في نسبة الأولاد لآبائهم. 
فسبحان الله الذي خلقنا متشاءبين ولسنا متطابقين حتى يحدث التايز بيننا والتعارف» 
ليس ذلك في الجينات والبصمات فقط؛ ولكن أيضا في أسلوب الكتابة. إن الكلمات التى 


مم 


يستخدمها كل منا وتصاريفها وتصاحباتها مع كلمات أخرىء, هي للكاتب كالبصمة 
للبنان. 


0 


الشّكل :5-١‏ القياس الأسلُون. 
5 -التعرف الآلىّ على الكلام (دمغتسصعمعع12 طعععمك عتأفسدماسى) 
الكلام ''' هو أفضل طرق التواصل بين البشر. وقد اكتسبت تقنية التعرف على 
الكلام أهميتها من ذلك. وتعد هذه التقنية خطوة نحو التواصل السهل والمريح بين 
الإنسان والآلة عند نضجها عمليا. 
وتطبيقات هذه التقنية كثيرة ومتنوعة» منها: 
٠‏ أنظمة الإملاء (عصتعمظ دمتتهماعنط), وتستخدم لإملاء مقال أو رسالة 
وتحويلها من صوت إلى نص. 
؟ تستخدم كأداة للإبحار والتجول (1001 7135183105) في بعض التطبيقات. 
وقد يكون ذلك مهما في مواقف مُعَينَةَ» مثل إمكانية إدارة مكالمة هاتفية بالكامل 
داخل سيارة وبدون الحاجة إلى البحث عن رقم الهاتف بالعين واليد. لأن ذلك 
يشغل عن قيادة السيارة. فتمكن هذه التقنية المستخدِمَ من إصدار الأمر بالبحث 


-١‏ يشير (الكلام) إلى الكلام المنطوقء ويُشير (النّضّ) إلى انض المكتوب. 


4 


هذه الطبعة إهداء من المركز 
ولا يسمح بنشرها ورقيا أو تداولها تجاريا 
رب اا لط ط ييا 


عن رقم هاتف مُعَيّن فتقوم بهذه المهمة. كى| تمكن هذه التقنية من الوصول لوثيقة 
أو كتاب وطلب قراءته» وعندئذ تستدعى تقنية أخرى لقراءة النصوص. 

*؟ تسجيل الاجتماعات وتحويلها آليا إلى محاضر اجتماعات: (01218260115م5 
60 ءءء م5)» وإن كانت نتائج هذا التّطبيق لا تزال دون المستوى 
المطلوب كثيرا. 


ومع نضج المجتمع الرقمى تتعدد يجاللات الإفادة من تقنيات الصوت وغيره. 
ولكن كيف تعمل هذه التقنية؟ ببساطة فإن كل تقنيات التعرف على الصوت والحروف 
والمتحدث تعمل تقريبا بمبادئ متقاربة. ويوضّح الشكل )5-١(‏ كيفية عمل هذه 


ع 


الانظمة. 


ميكرفون ذبذبات الصوت 
بداء نماذج للأنماط 
المختلفة المطلوب 
التعر ف عليها 


القرار 


يقرر أي الأنماط 


أقرب 
ر 


الشّكل :5-١‏ نموذج عامٌ للتَّعرّف على الأنماط. 


؛ و 17- تحويل التّضّ إلى كلام (115 - طءءءمة 0) 18:4 

هذة النقية ها نط قات عملية قكر متها تعلق الككب للمكقوفين وعشاف ابص 
ومنها نطق الرسائل عبر الحاتف للإخبار عن خدمة أو إعطاء معلومة... إلخ. وتتكون 
هذه التقنية من تقنيات أخرىء والشكل )72-١(‏ يبين مكونات تقنية تحويل النص إلى 
كلام العربي. 


دو همد 


ناطق الكلام المشكل الآليْ ١‏ اننصّ العربيّ انام 
1837 عاطم 


اععءم5 11111 ْول النُصوص 
أده 1 


51 لعن ري 


الشّكل :7-١‏ مُكَوّنات تقنية تحويل النص إلى كلام. 


يلاحظ هنا أن العربية تحتاج لمشكل آلي» وهذا الجزء غير مطلوب في اللغات اللاتينية 
حيث تكتب كل الأصوات غالبا. فقط تحتاج إلى بعض القواعد للنطق مثلم| يحدث عند 
نطق كلمة آخرها (600]...). 

وبالنسبة لتقنية ناطق الكلام (5[/2]651261 5066011) لها مدرستان» مدرسة تعتمد 
على تقطيع الفونيمات من كمية من الصوت امعد للتدريب إذ يقطع الصوت المسجل إلى 
فونييات. وتُستدعي الفونيهات المطلوبة في سياقات متشابهة وقت تعليم التقنية سلفاء 
وهذه الطريقة هي الأكثر شيوعا. 

ولكن هناك مدرسة أخرى تعتمد على توليد نماذج رياضية لكل صوت. ويمكن 
تدريب وتعليم هذه الناذج سلفا. المدرسة الأولى يكون الصوت فيها طبيعيا أكثر ولكن 
يعاني بعض التقطيع في السلاسة والانسيابية؛ والصوت الناتج عن المدرسة الثانية أكثر 
انسيابية ولا تشعر الأذن فيه بتقطع أجزائه لكنّه لا يبدو طبيعيًا كالضّوت التّاتج عن 
المدرسة الأولى. وكلا المدرستّين تسعى إلى تحسين الأداء بزيادة كمية الصوت المستخدم 
وو الكدوني» 

ولازالت الأبحاث قائمة لزيادة درجة التعبير في الصوت (اعءعءم5 176ووع1م<18) 
حتى يتسنى للمستمع تمييز الاداء المتسم بالفرح أو الحزن أو الفزع أو الغضب ... إلخ. 
كما يمكن تمييز الاسلوب الخبرى من الاستفهامى ... إلخ. 


-غ١-‎ 


هذه الطبعة إهداء من المركز 
ولا يسمح بنشرها ورقيا أو تداولها تجاريا 
:ا ييا 


5 البحث فى الصوتيّات والمرئيّات (اعنوء5 مع710؟ سه منلسم) 
فيها). هب أننا نريد أن نبحث في ملفات صوتية كثيرة (بالآلاف) عن ١صلاة‏ العيد) 
حتى نعرف الآراء المختلفة حول فقه صلاة العيد مثلاء حيث تغنينا هذه التقنية عن 
الاستماع إلى هذا الكم الحائل بآذاننا لنصل إلى ما نريد» حيث تقوم التقنية باستعراض كل 
هذا الكم من الصوت وتختار المواضع التي تشتبه في تعبير «صلاة العيد» وتدلنا عليها. 
ولهذه التقنية استخدامات كثيرة منها: 

؟ البحث في الخطب والتّسجيلات الصوتية عن موضوعات تهمناء ويمكن أن يتم 

ذلك أيضا في المرئيّات (في مسار الصوت فيها) لاستخدامات بحثية أو ثقافية. 
٠‏ محطات الإذاعة والتلفزيون تحتاجه لإعداد تقارير عن شخصية أو حدث أو مؤسسة 
فتستدعي ما سبق قوله حوطا في تراثها أولا حتى تكون منسجمة مع نفسها فيم| تعله. 

٠‏ لأسباب أمنية يتم تسجيل المكالمات الدولية في كثير من دول العالم؛ والاستماع 
إليها يكون شاقا جداء لذلك تُستدعى هذه التقنية وتزود بمجموعة من الكليات 
التى لو وجد بعضها تنبه المعنيين بالأمر للمراجعة الدقيقة (مثال للكلمات: 
مخدرات. أفيون» هيروين» أسلحة....). 

؟ ونظرًا لتزايد حجم الصوت وامرئيّات على الإنترنت حاليا ومستقبلاء فإن هذه 
التقنية ستفيد الباحثين عن المحاضرات والخطبء. بل والأفلام» وكل المطلوب 
منك هو كتابة عدة كلمات تذكرها من أحاديث من فيها مثلا» فتستدعى أقرب 
هذه الخطب أو الأفلام. 

وتعتمد هذه التقنية أساسا على تقنية التعرف على الكلام» إما بصورة كاملة أو 
بصورة جزئية. 

وجدير بالذكر أن كلمات البحث يمكن كذلك أن تكون بالصوت بدل الكتابة» 
وهذا يخدم مستعملي الهواتف التّقَالة. وكذلك تشمل هذه التقنية البحث في الصور 
فيكفى أن تكتب كلمة «هرم» لتستدعى آلاف الصور التى عوجت من قبل ويظن أن 
بهاصورة«(هرم). 


5غ 


و -١5‏ التعرف على اللّغة («منغتصعمء»18 ©1.325125) 

تزايدت الحاجة إلى هذه التّقنية بعد ظهور الإنترنت والانفتاح على كل الثقافات 
واللغات؛ فإذا حصلنا (عند البحث عن موضوع ببمنا) على حديث صوتي له صلة 
بموضوع البحثء وأردنا معرفة لغة المتحدث لنعرف من أي البلاد هو كخطوة أولى 
نحو معرفة ما يقول. إذ نستدعي تقنية التعرف على الكلام المدربة على لغته التي يتتحدث 
بها. 

هذه التقنية يمكن شرح فكرتها باستدعاء النموذج المشروح في الشكل )0-١(‏ وبدلا 
من أن تكون الأنماط عبارة عن كلمات», تكون الأنناط عبارة عن صوت بلغات شتى» 
ويدرب النظام على اللغات التي يراد التعرف عليها. وبعد تكوين الناذج الرياضية 
لأصوات كل لغة يصبح النظام قادرًا على التمييز بينها عندما يتعرض لإحداها. 

ومن الجدير بالذكر أن التعرف على اللغة من النصوص المتاحة أهون بكثير اذ يكفى 
أن نحتفظ بالشائع من كل لغة من الألفاظ والتعبيرات لاستخراج لغة المقال الذى نريد 
معرفة لغته. 


-١6 , 4‏ تعلّم التُطق بمُساعدة الحاسوب 

(2121125عآ 1221261013 نتطمتدط 1060 خش حاء ]نام ته )) 

تُعَذٌّ مهارة النطق أقل المهارات التي نجيدها عبر عملية تعلم اللغات الأجنبية 
بالطرق التقليدية. فكم منا يجد صعوبة عندما يحادث أجنبيًا لأول مرة أو يستمع إلى 
نشرة أخبار أجنبية؟ لذلك فإن هذه التقنية مستقبل مهم في تيسير تعلم اللغات. 

ويمكن أن نصنف هذه التقنية كتقنية متشاءهة وغير متطابقة مع تقنية التعرف على 
الكلام. حيث تتفق هاتان التقنيتان في تحليل الصوت واستخلاص خصائصه وبصاته» 
ففي تقنية التعرف على الكلام مطلوب التعرف على الكلمة أو الجملة المنطوقة, أمّا في 
هذه التقنية فالكلمة أو الجملة محل البحث معروفة سلفاء ولكن المطلوب هو التأكد 
من نطقها نطقا سليها. فعندئذ توضع البدائل المختلفة للنطق» الصحيح منها والخطأء 
وتقوم التقنية بالتعرف على النطق.. هل كان أقرب للنطق الصحيح أو للنطق الخطأً. 
خذ مثالا: لو أن أجنبيا يريد تعلم العربية وليس عنده حرف مثل «الطاء» ويريد أن 


دمع 


هذه الطبعة إهداء من المركز 
ولا يسمح بنشرها ورقيا أو تداولها تجاريا 
رب اا لط ط ييا 


ينطق كلمة «طبيب» فإنناسلفًا تدرت النظام على كلمتين «طبيب» و «تبيب») فإذا كان 
النطق أقرب ل «تبيب» نعطي تغذية مرجعية للمتعلم بموضع الخطأ ونطلب منه معاودة 
المحاولة وربما نحيله إلى طريقة نطق «الطاء» تفصيليًا. وهكذا يتعلم الأجنبي كيف ينطق 
الحروف والكلات العربية. 

وأهمية هذه التقنية تكمن في أن التدريب عليها يحتاج إلى وقت وصبر طويل قد لا 
يتوافر عند البشر» ولكن الحاسوب ليست لديه مشكلة في ذلك, ولا يمل التكرار الذي 
هو أساس في هذا الموضع. 

ومن أبرز التطبيقات التي ظهرت في هذا المجال تقنية لتعليم أحكام التجويد تحت 
اسم «حفص» وتعد خير مثال كتطبيق نافع في مجال مهم. 
محاكاة للعلاوة 
قف الدموذجية 


10 00059 


موافقة لأحكام 

التلاوة 

الشّكل :6-١‏ تقنية احفص» - تعلّم التُطق بمُساعدة الحاسوب. 

5 و -١1‏ التعرف الآلّ على الكتابة المطبوعة (060:18 651665م19) 

تتجه البشرية إلى إتاحة تراثها في شكل رقمي حتى يسهل التعامل معه من استدعاء 
وتلخيص ونطق آلي....إلخ. لذلك نشأت أهمية هذه التقنية. إن كمية الوثائق الحكومية 
وغير الحكومية وكمية الرسائل العلمية التي تعمر مكتبات مئات الجامعات في المنطقة 
العربية تحتاج إلى تقنية عالية الجودة لتيسير رقمنة هذه الوثائق. 


0 


وتقوم فكرة تقنية التعرف الآ على الكتابة المطبوعة (مع اختلاف الخطوط نوعا 
وحجما) بمسح ورقات الوثيقة أو الكتاب آليّا فيصبح صورة رقمية» ثم تقوم التقنية 
باستخراج الأجزاء من الصورء (البوجااي! صوص مطبوعة ثم تفصل الأسطر ثم 
الكلمات (وربها الحروف»» ويتمٌ التّعرّف على (الحروف ثُمّ) الكلمات فالجمل فالفقرات» 
والشكل )4-١(‏ ليبين الفكرة الأساسية. 


الشّكل :9-١‏ التَّعدّف الآ على الكتابة المطبوعة. 


١1, 5‏ - التعرّف الآ على الكتابة المخطوطة (عه0:36مد11 +0©1) 

وتشبه هذه التقنية سالفتّهاء إلا أن الخطوط اليدوية لها تحدياتها ومُشكلاتها المختلفة 
نوعا ماعن مُشكلات الكتابة المطبوعة. المشكلة المراد حلها هنا هى نفس المشكلة المراد 
حلها فى نقية التمرق فلل الكعاية المطبوحقة ولكن المادة الخدم للتدريب والتعرف 
مختلفة كثيرا. ففي حالتنا قد لا تكون الأسطر والحروف منتظمة» حتى لنفس الكاتب 
وفي نفس الوثيقة» حيث يختلف شكل الحرف ني كل مرة يكتب فيها (على خلاف الكتابة 
المطبوعة). 

4 و4١‏ التَّمرّف الآ على الحَرُوف 

(02اتصممعع]1 “اعاع2 تقطن) أسدععتلاء)ه1) 

بعد اتعلنان النوانتنه التثالة ات الساقات الفناسة لمن ومن قل ذلق طهور 
الحواسيب اللوضة [التى يمكن الكتابة عليها] (1]65ام2م» 130161): ظهرت الحاجة 
لثل هذه التقنية لأنَّ الكتابة بالقلم عند عامة الناس أسهل من استخدام لوحة المفاتيح. 
وإذا كان استخدام لوحة المفاتيح في حالة الحاسوب ممكنا لاتساع المكان وطول الدربة» 


دق تت 


هذه الطبعة إهداء من المركز 
ولا يسمح بنشرها ورقيا أو تداولها تجاريا 
):ُ6ا ب ييا 


فإن الكتابة باستخدام لوحة المفاتيح على ال هواتف التَقَالة أصعب ولذلك تكتسب هذه 
التقنية أهمية أكبر في هذه الحالة. 

قير ظروق نعثه الشبه يدر اصيقات موا منها أل لا لريجت كوكناه كا ذا 
المشتحابف السو رس الها البد أوالكناية المطبيعة عادر لديا معلوهاتك عدر 
عن وضع القلم وترتيب الكتابة قد يكون مفيدا عند التطبيق. وتتفق هذه التقنية مع 
سالفتيها في نفس النموذج المرجعي في الشكل )4-١(‏ الوارد آنفا. 


4 , - تعلّم الَطّ بمُساعدة الحاسوب 

(2121125ع بط خده"اآ 10خ اء )نام ده0)) 

هذه التقنية تشبه تقنية تعليم النطق السليم للغة أجنبية. فهي تساعد على وزن نسب 
الأطوال والزوايا المختلفة لكتابة الحروف وتراكيبها للغة ما. إن توظيف الحاسوب 
للقيام بهذه المهمة يعد استخدامًا مناسبًا لرفع كفاءة المدارس في تحسين خطوط الطلاب. 
ويمكن بالطبع الانتفاع بها لكل الأعمار ولمن سيتعلم اللغة من الأجانب أو العكس عند 
تعلم العربي لكتابة الحروف اللاتينية تينية أو الصينية مثلا. 

وكا قيل في تعليم النطق يقال هنا. إن أصل ومرجع التقنية هو الشكل ))72-١(‏ 
مع وضع مواصفات للمقاييس ال حرف المقبول؛ فإذا تم الالتزام بها يعطي الكاتب تغذية 
مرجعية إيجابية؛ أما إذا خالف في تلك المقاييس ذ يدو الصعرت ص موضع الخال ويعفي 
تغذية مرجعية عن الخلل وموضغه. ولا يمل الحاسوب (أو الحائف التقال) من طول 
التدريب حتى تصقل المهارة ويتحسن الخط. 

تقنيات مركبهة 

5 و -3١‏ تقنية قراءة الكتب (1»2061 06001 

وتتركب هذه التقنية من تقنيتين فَرعِيتنَه حيث تُعنى الأول بالتّعرْف على اروف 
بعد إدخايها إلى الحاسّوب في هيئة صُوَّرِ باستخدام الماسحات الصَّوئيّة. ليحرل شكل 
اليند + يذلك - من صُورةٍ ورقيّة إلى صُورةٍ رقميّة يُمكنٌ النَّحَكُمٌ فيها؛ وتُعنى التق 
الأخرى بقراءة النُصُوص من خلال تحويل النّضّ (المكتوب) إلى كلام (منطوق». 


-55- 


تقنية التَعرّف الآلى 


على الحروف 


الشّكل :٠١-١‏ تقنية قراءة الكتب. 
5 و١"-‏ تقنية الثّر حمة الشَمهيّة الآليّة (102)فاقطة"!' طاععع مك 0غ طاعععمهة) 


وفى ثقنية مغقدة إلى درحة كبيرة» إذ نتكون من 5 تقتيات عل التخر لمن بالشكل 
و( درل 


الشكل ١١-١‏ : تقنية النَّّحمة الشَّمَهِيّة الآليّة. 


-لاع- 


هذه الطبعة إهداء من المركز 
ولا يسمح بنشرها ورقيا أو تداولها تجاريا 
:ا ب الل ييا 


5 , 77- أنظمة الاستجابة الصَّوتَيّة التَفَاءْليَة 


171 - بصع أة59 عمموموع] عع1م؟ عتكتاعه 1عام1) 


كا في الشّْكل (137-1). فإن تقنيتي التعرف على الكلام ونطق النصوص تستخدمان 
الي ل 


الشّكل :17-١‏ أنظمة الاستجابة الصَّوتِيّة التَّاءْايّة. 


4 , 77- تقنية تحويل الكلام إلى لّغة الإشارة» والعكس 

(طعععم51511-1211511256-10-5 على ©0-1211511256ع1ك-0]-طاعء6م5) 

في هذه الحالة تستخدم قفازات خاصة بها حساسات ترسل إشارات للحاسوب 
بموضع كل كلمي ل أصابع اليدين. وباستخدام تقنية تحويل إشارات القفازات إلى 
نصء يمكن استخدام تقنية نطق النصوص لتحويلها إلى كلام والعكسء إذ يمكن 
تحويل الكلام إلى إشارات للصم والبكم. فالمتحدث يحول كلامه إلى نص باستخدام 
تقنية التعرف على الكلام» ثم تحول إلى إشارات على شاشة الحاسوب» وهكذا يمكن 
وصل الصم والبكم بالجمع» فقط نحتاج إلى قفازات مها حساسات وميكروفونات 
وحاسوب أو نقّال يمكن أن تَحَمّلَ عليه التقنيات؛ ى) أن هناك جهود بحثية للتعامل مع 
صورة اليدين عبر كاميرا ولكن لا تزال نتائجها دون المستوى التطبيقي. 


حل ةب 


الشّكا 1-١‏ : تقنة تحويا لغ الاشارة الى كلام والعكس . 
يه حور وشارة إلى كلام2 و 


5,:5؟- أنظمة إدارة الجوار (35ع)535 )تع ترعى 2 سقدم ع21210) 

وتشبه أنظمة التفاعل الصوتي» والتي تحتاج إلى تقنيات التعرف على الكلام ونطق 
النصوصء ولكن يضاف إليها تقنية عميقة لفهم الكلام وتقنية أخرى لتوليد الكلام. في 
الواقع هناك طبقة مبسطة ومبرمجة لأنظمة التفاعل الصوتي 17/15, لفهم وتوليد الكلام ولكن 
إدارة الحوارات تحتاج لدرجة أعمق لفهم الكلام وتوليد الإجابات. نحتاج إلى محللات 
صرفية ونحوية ودلالية «ومحلل منطقي» لما يقال. هذه الأنظمة ستنقل الآلة لمستويات أعلى 
بكثير من حيث سهولة التفاعل مع الإنسان وحسن توظيف إمكانياتها لخدمته. وسوف 
تستخدم بكثافة مع «الإنسان الآلي» (180001) في ثوبه الحديث. إذ سيكون في مقدور هذه 
الآلة الذكية «الإنسان الآلي» القيام بكثير من الأعمال الروتينية في المنزل والمصنع وخدمة 
الأطفال وكبار السن والمرضى على مدار 5 ؟ ساعة في اليوم دون كلل ولا ملل. بل ربا يكون 
قادرا على الحكاية والترفيه لإخراج مستخدميه من *مومهم واللعب معهم بذكاء وحضور. 


جراد 
ناطق : 
ص اج ] 


الشّكل :١4-١‏ أنظمة إدارة الحوار. 


-94غ- 


هذه الطبعة إهداء من المركز 
ولا يسمح بنشرها ورقيا أو تداولها تجاريا 
| ار > لآ ييا 


5 , 76- الأنظمة المتَقَدُمة لاسترجاع المعلومات 


(قططاء)575 11112721 2100 حم تمكس]ط لععصد حلى) 


لا تكتفي هذه الأنظمة با سترجاع المعلومات المحَرّنة في أوعية المعلومات في صُورَتها 
الباقتر ةو نا يمسعيليها لشي - كذلكَ- استرجاعٌ معلوماتٍ مُعَقدة من مجموعاتٍ 
تاتون الوتاكق والأوضيةبالافيافة إل قدو هنو الأنظبة عل دلكرصن العلربات 
المسترجكة إذاكقت انشاجة إلى ذللقه أو النترساعها من لات ختلقة: أو استخدام 
أساليب م مُتقَدّمة في عمليّات الاسترجاعء كأن يُستَحَدَمَ الصَّوتٌ عبر ا حاتف التّقَال أو 
اللعن فل الرانيي الأرةوعوذلك كا الكل ذا -16). 


(صتوعة)رست)( 


الشّكل 15-١‏ : الأنظمة المتَقَدّمة لاسترجاع المعلومات. 


-80 ٠ 


5 ,76- التّنقيب في النصوص (عصنمن31 ).1) 
0 هذه التقنية ة إلى 00 000 عالية لوف من البيانات الَضَّيّه. 


0 


ا ّ انها ني راع بياناتٍ نَصَيّة؛ برو بامبخلاض الوم من 
قواعد البيانات؛؟ وانتهاءً بتقييم النتائج. وتتفرّعٌ عن هذه التّقنية تقنياتٌ أخرى. منها: 

٠‏ تحليل المشاعر. 

؟ تلخيص وتصنيف وتجميع وض 

* التَّقيب عن اتجاهات الرَّأي. 

٠‏ التصحيح الآلى للنصوص. 


هه 0 2 
ا و 
ال رت اه 
6و -١‏ مؤسّسات ذات طابع أكاديمىٌ 


2 مُوّسّسة (002501:11112© 12212 عتاكتتاعستأنآ) :1:12: 
هي مُوّسّسة بحثيّة تُساهم فيها مجموعةٌ من الجامعات والموَّسّسات المعزيّة بالموارد 
اللْعَويّق بالإضافة إلى عددٍ من المخترات البَحزيّة الحَكُومِيّة. تأسَسّت في عام ١997‏ 
بدعم من وكالة مشروعات البحخوث المتَقَدّمة (ماءءزمء2 باءعتوعوه ]1 عدسيناة عط 
1124م - الإعمعع 8 ). تولي مَوّسّسة 1.1120 عناية ببناء المدّوّنات اللو يّهَه وقواعد 


التجانات اللعويّة الكتوية :وا لنطرقة). ولمعا اللكرية لأغراض لتحت والتطوي. 
د مق (تجامعة نسلفاننا - الو لايات المتحدة الأمريكة. 


٠‏ الموقع الإلكترونٌ: نالء.صصعمنا.عل1. ج/ / :مقط 


م١‎ 


هذه الطبعة إهداء من المركز 
ولا يسمح بنشرها ورقيا أو تداولها تجاريا 
:ا ييا 


9 من لوده عَرَبيّة: 
- المحلّل الصَّرف للح ا 111 (مُرَوّد بمُعجم لعَوي). 
-- الينك اللحوي العربى 16هتتث علصدحاءه :1 . 
5 مُعجم اللّغة العربيّة الدّارجة في مصر (مُعجم العامّيّة المصريّة). 
- العديد من المدَوّنات اللَعَويّة للعاميّات العرييّة (في مصر والعراق). 
* فريقٌ البحث في مُعاجّة اللّغات الطَبيعِيّة» كله عُلُوم الحاسوبء ليدز: 
(ك0ععآ 01 تجاأوتاء كتطنا عطا )2 عستانامصرهن) 01 [ممطعك - طلاة) 
1 عُلُوم الحاسوبٍ في جامعة لبد انهه كادي : مُتَخصّصة 8 
الدّرجات العليّ للباجئينء وتُشرف على أطروحاتهم للماجستير والدّكتوراء ا 
مُصَتَةٌ ضمن أفضل «اجواتييات كاري لحمو ل عازه الكابويدي الوا 


المتّحدة . يعمل فريقٌ البحث في مُعاجة الّغات الطَبيعِيّة بالكُليّة في مشروعات بِحؤئيّة 


مُشتركة» ويُولي عناية خا مد قياف اللكة القررة: بيه ومواردها اللْعَويّة. يَرَكُرْ الفريق في 
أبحاثه على تيدجة اللحلاويفاء لدو نات اللقرية العرك 


و 


* المقرٌ: جامعة ليدز - المملكة المتّحدة. 
* الموقع الإلكترونقٌ: 


/ 051]512011316م/ 8ن نامطامع/ علنا. عق . كلعه1. عمتاععطتع م . تتم / :خط 
اتلتاطة.ع مزووءعء10م-86 13208112 -21تتتتقم/ كاءة زه0عم/ وععتعه0 ماع توعوع1 


ين الواية الك عَرَبيّة: 
ب م 
5 المعتنون التٌّلقائِيَ لأقسام الكلام في اللّغة العربيّة المكتوبة. 
- نمودّج حاسُوب للتَّمِيل امعرق في القرآن الكريم. 
ع لالدو الت + العرب» بيه لُصُوص القرآن الكريم. 


ام - 


* المتَظّمة العَرَبِيّ للتّربية والثّقافة والعُلُوم (ألكسو)- إدارة العُلُوم: 
113 2110151 611:21 [نان) ,[0112610113]آ عتاعوء ا مورخ ع 1' 
1050 - 
مع مطلع الألفيّة الثالئة وجَّهَت إدارةٌ العُلُوم بالمتَظّمة العَرَييّة للثّربية والثقافة 
الُلُوم عنايتها إلى حوسَبةاللّة العربيّة» فعقدّت عددًا من المؤتمرات والمحافل ادلي 
وأنجرّت - ولا تزال - عدَّةَ مشرُوعاتٍ تب محال المعالجّة الآليّة للغة العَرَيية اعم ل 
مشروعات حوسبة النّخة بإدارة العُلُوم عددٌ من الأكاديويين والخبراء العرّب من خلال 
و مل وجو عات حبق كا تتعاون مع المتلّمة مجموعة من المسّساتٌ والهيئات 
المعنيّة بحوسبة اللعة العَربيّة به در الإشارة إلى عناية لمق العربيّة 1 والثقافة 


والعُلُوم بتوفير تقنيات اللّة العربيّة المنجّرّة في صُورةٍ خرّة أو مفتوحة المصدر سعيا 
إلى إتاحتها للباحثين من ناحية» والعمل على تطويرها ومُعاجَة جوانب القُصُور فيها 
من ناحية أخرى. 
* المقرّ: توس. 
٠‏ الموقع الإلكترونٌ: 50.018ع7.316/ / :مقط 
٠.‏ ف اللراركا استرية ار 
- نظام التتحليل الصَّرقٌ «الخليل». 
- المعجم العرب التَفَاعِنَ. 
من المشروعات القائمة: 
- نظام التّحليل النَحويّ. 
د الدقّق الإملاي للعة العريية 
: آكيّة تشكيل النصُوص العرَبيّة. 


وهات 


هذه الطبعة إهداء من المركز 
ولا يسمح بنشرها ورقيا أو تداولها تجاريا 
):ُ6ا ب | ييا 


؟ِ_ مدينة الملك عبد العزيز للعُلُوم والتّقئية (معهد بُحوث الحاسب): 
(087[مصطعع1!' 220 ععدعك ك5 :د10 1ن مأجقلاسلطى عستككل) 

71 سس المعهدٌ في عام لأغراض البحثِ الي تخدم المملكة العربيّة الشُعودية 
0 للعُلُوم والتّنية في مجال تقنية المعلومات. . ويَضمٌ المعهدٌ أربعة أقسام علميّة. 
هي: : قسم الصّوتِيّات واللترتاكة وقسم الحوسبة العلمية» وقسم النظم والشّبكات» 
وقسم هندسة البرمجيات والأنظمة المبتكرة يُعنى قسم الصّوتيات واللَعَوِيّات بإعداد 
البُحوث والدّراسات وتقديم ال لول أُشكلات حوسبة اللّغة العربيّة كما يقوم بتقديم 
الاستشارات وإقامة المؤتمرات والنقافاف العلميّة المتخصّصة متابعة التَطوّرات الحادثة 
في ميادين تقنيات اللّغة والبحث في سبل التَّعاونَ مع مراكز الأبحاث والتّطوير الدولية. 

* المقرّ: مدينة الملك عبد العزيز للعُلُوم والتّقنية - الرّياض - المملكة العربيّة 
السّعُودِيّة. 
* الموقعالإلكتروفٌ: 
257 011.53/31/0131/1151161165/2865/66ع.51ع ةع .177777//: خط 
* من الموارد اللِعَويّة للعرَبيّة: 
-- اليئك السّعُودِيٌ للأصوات. 
- المقَوّم الآيّ للمقالات العربيّة. 
نظام مُعالجحة الُرٌّوف العربيّة المطبوعة. 
- مجموعة نظم التّحليل النّحوي للنصوص العربيّة المتاحة على الإنترنت. 
- مدونة عربية نصية كبيرة. 
* من المشروعات القائمة: 
- مشروع بناء نظام تفاعلي للتَّعَرّف على الأصوات العربيّة. 
- مشروع ويكي عربي - لإثراء موسوعة ويكيبيديا العربية. 


عم - 


2 مجموعة كولومبيا لنمدّجة اللّهجات العَرَيية جامعة كولومبيا: 
(131للخ ) «منا0 1ه عتتاء85100 اعع0121طآ عتطوترحى 5 ةأطسسس[اه0)») 
ميرف بعد كرننا فريقٌ البحث في مركز أنظمة التعَلّم الحاسوبيّة (101 تامع 
5-- - ماع اولا5 4911 بجامعة كولومبيا الأمرد يكِيّة. يق 
الفورق و تمعاطة الليجانة العربيّة ويستنل إلى عادر اللّغة العرَبيّة المعاصرة (2/100620 
ذذا- عتطهتث 0210 مهاد ) . 5 اللعيوع مشروعا للتَّعدّف الآ على الكلام 
1ك شخ- مه انمع معع ]1 طاععءم5 2116 مناخ عأطوتث ). وهدف المشسر و ع ما 


- إلى تعيين أوجه التَّايّن بين اللّهجات العرييّة على مُستوى الأصوات والتّراكيب 
والمعجم. كما امتد اهتمام المجموعة للترجمة الآلية من العربية إلى الإنجليزية والتعامل 
مع اللهجات العربية. 
ف :311 افدة كزالر بن كموي الولاناك ا دده 
الموقع الإلكتروفٌ: تلدع /تلء .ة1طامسسامء.كاءء. 1 /7//:ماخط/ 
“- افق الوازة اللحوة للعريية: 
- نظام التُحليل اللَغَوِيَ 1ل81424+1014. وهو نِظامٌ لتحليل 
النصوص العربيّة المكتوبة» ومن مهامّه: 
_- تَقطِيع النصوص (28]108نصع101). 
- التشكيل الآلّ (ممتاه جنات 2 1). 
- فَكَ الالتباس الصّرة ف (م هقتاع 1طصصدذطآ لدعاعه1[مطم:8/0) . 
- عمليّات تَعبين أقسام الكلام (8لع138 205). وَالتّجِذِيع 
(18لتتتتاعا5)ء و التّفْر يع (10 21172110 قتاع ) . 
* فريقٌ البحث ني مُعالجة اللََاتِ الطبيعية بجَامعَة سنَانْفُوزد: 
(منا10م) ظططآلظا 101:0 سماد عط1) 
اه لاحر ل ١‏ وير 0١‏ يَتَألْفَ 


هذه الطبعة إهداء من المركز 
ولا يسمح بنشرها ورقيا أو تداولها تجاريا 
|6 ::: اللطصااهههه ههه + - ا 


يَعْمَل أَعْضَاوه معًا على المُوارِزُميات التي تَسْمَح لأجهزة الكمبيوتر بمعالجة وَقَهُم 
اللغات البشرية. 
8 اللقة: كاليشورتا- الولثيات المفحدة الأمريكة. 
٠‏ الموقع الإلكترونّ: دلء.70متصماد. ملم/ / :ماخط 
»ء من المشروعات: 
- نظام ستَانْفُورْد للتّْكمة الآلية. 
- نِظَام سِتاتمووة يه مُدَوّنات اللّغات الطبيعية. 
- نظام ستَانْفُورْد المْنُوح لِإسْتِخْراج البيّانات. 
* مَعْهد قَطَر لِبُحوث الؤْسَبة (0173©) 


(]نتاقصط طاعروعوع ]1 عط تنام درهن) :121 0)) 
هُو مَعْهد بَحْنِيُ غَير نحي تأسس كَجُرْءِ من مؤسسة قَطَر للتربية والعلوم وتنمية 
المجتمع في عام 270٠١‏ ومن تَخَصّصّاته التي يُركز عليها يَقَّات اللغة العربية والحوسبة 
عالية الأداء والمعلوماتية الحيوية. 
* المقرٌ: الدّؤْحَة - قَطر. 
0 الموقع الإلكترونيٌ: 067.018.02/ / :مقط 
٠‏ تحدّيات الْمهد في يحَال تِقييّات اللغة العربية: 
- تَحَدّي التّدحمة الآلية للغة العربية. 
- دي مُعَلّم اللغة العربية الإلكترون. 
- حَحَدَي نظام الحَادَنّة المستمرّة باللغة العربية. 


- خَحَدَّي المحتوى وَالبََحْث باللغة العربية. 


-جهم- 


" الجمعيّة المصريّة ا هندسة اللّغة 117[ 550: 
(5111611125 1/11 ع21151125آ 01 500167 تلقتامرع] عط1) 


ا 


نشْكّت ام ا سور جا شيرع ل بعري 1 
قارب ين كاين ولباحين اين والتين والستخدمي من تاف 
تابة ال يفي 1 ةب ا 2 

0 5 
*؟ الموقع الإلكتروني: ع01.عء-ع501ء./0777/ / :مقط 
٠.‏ من أنشطة الجمعيّة: 
- عقد مؤقرٍ سنوي لهندسة اللّغة» يُناقِشُ مختلف القضايا في حوسبة اللّغة 
وتطيقاقا: 


- عقد ندواتِ وورش عمل للإفادة من خبرات المتَخَصَّصِين في يجا لات 
7 3 1 8 1 7 3 


" مركز تقنيات اللغة العربيّة 41:1710: 
(عامعن) نوع 10مسصطءء]1' ا عأطودة) 


علو ند 


م مُوَّسّسَة أهلية لا مهيف إلى الرّبح. سّسّ المركز في عام 7٠١4‏ بدعم من شركاتٍ 
َي ومُوّسّساتٍ بحئيّة وأكاديميّة وهدف إلى توفير الموارد اللْعَوِيّة للمَعنيّن بحوسبة 
الغة العريّة من الباحثين والمطوِّينء كما تهدف إلى تنمية الموارد لبشريّة من خلال 
اللدويي عل عا راع سلب اللحة العركة الو ا كي 
بالجامعات والمؤسّسات الأكاديميّة. ويُعنى المركرٌ بتقديم الخدمات التَقَيبّة لذنوي 


الاحتياجات الخاصّة من خلال تطوير التّقنيات المناسبة لاحتياجاتهم» كا يُعنى بتطوير 
التّقنيات عافن ول اله العررية لكر الناطفين عا 


-لام- 


هذه الطبعة إهداء من المركز 
ولا يسمح بنشرها ورقيا أو تداولها تجاريا 
:ا ييا 


9 المقرٌ: الجيزة - مصر. 
٠‏ الموقع الإلكترونٌ: 1.018عادعء-عع 7707.1 / :ماخط 
يفرع أنشطة المركق: 
- عقد مؤتمرات في حوسبة اللغة العَرَييّة وتقنياتها. 
- إنجاز مجموعة من الأنظمة والموارد اللغوية للباحثين والمطورين. 
ين المواود اللكوكة للعركة: 
- مجموعة ضخمة من قواعد البيانات المستخدّمة في التَعرّف على الُرّوف 
العرييّة - سواءٌ أكائت مسوحة ضوئيًا (بجتوى على - ١4٠٠٠‏ صفحة) 
أم مكتوبة باليد (كتابه لآلف كاتب كتابة آنَيّه عمناحهه). 
- مدَوّنة لَّويّة مضبوطة بالشّكل الكل أنجرّت باستخدام آليّة التُشكيا 
الآليّ للتصوص العَرَبِيّه وكذلك تحشاة بأساء الكائنات ويصل حجم 
اللدونة إلى #امللايين كلمة. 
ه, ”- شركات مهتمة بحوسبة اللغة 
وتجدّر الإشارةٌ - كذلك - إلى وجود العديد من الشّركات المعنيّة بحوسبة اللّغة؛ 
كبا عل شييل الخال ل نص : 
لا 


شركة «آي 7 إم): 
03 1121115 ووع2 أكتاظ 210221 صترعءغم1) 18131) 


ف.. امقر اليس : فويورك- الولأيات اللجيدة: 
٠‏ الموقع الإلكترونّ: 2امء. ستطاة. مجس/ / :مصاخط 
" شركة «مايكروسوفت) 2/110150501]6: 
* المقرٌّالرّئيس: واشنطن - الولايات التحدة 
٠‏ الموقع الإلكترونٌ: امء.]0501 ع تمط. 1557ا/ / :ماخط 


-هم- 


" شر كة (صخر) 108577مصطءء1 ع5 2 تاعصة.آ عتطقترة - عند الود كلدك : 
© المفرالركسن: القاهرة ب وضل: 
. الموقع الإلكتروقٌ: حنامء . تطعلهه. 157/ / :ماخط 
3 9 87 ىيى يي ب ِ 
" الشركة الهندسية لتطوير النظم الرقمية «اردي اي): 
067102121[ قتداء)575 10151621 101 :2137م020) ع تالتاعء تناع ص1 عط 1 ) 01خ1) 
9 


المقرّ الرّئيس: الجيزة - مصر. 
0 الموقع الإلكترونٌ: حتامء.عء-نل1. 77057 / :مصاخط 
”- أفكارٌ بحنيّة لأطروحاتٍ علمية مُستقبلية 
-١‏ إعداد دراسة عن أهمّ التّقنيات التي قُدّمَت في حوسبة اللّغة عمومًا وحوسبة 
اللغة العربيّة على وجه الخُصوص. 
؟- إعداد دراسةٍ عن أهم التطبيقات لهذه التقنيات في حياة الناس. 


- البحث في مستقبل هذه التقنيات والتطبيقات وخاصة في عصر الهواتف النَّقَالَ 
وما قد يتطلبه ذلك من إعادة النظر في أوّليات المعالجات اللغوية. 


4م - 


هذه الطبعة إهداء من المركز 
ولا يسمح بنشرها ورقيا أو تداولها تجاريا 
:ا ييا 
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ولا يسمح بنشرها ورقيا أو تداولها تجاريا 
:ا ييا 
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155711 .2106655118 1212511286 131131 10 


5 1218511286 81361131 :(2015) .5 ,ااعصخ- لاخ عك .4 ,نقكنامطاد .25 
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الفصل الثاني 
التحليل الصوتيٌ 


(الدّراسة التّحليليّة للصّوت اللعويٌ 4 العصر الحديث) 
5. أحمد راغب 


١‏ - تحليل الصَّوت اللّغويٌ. 


؟- آليات التنفيذ» وإعداد قاعدة البيانات الصوتية. 


ا 


هذه الطبعة إهداء من المركز 
ولا يسمح بنشرها ورقياً أو تداولها تجارياً 


5ب 


مدخل 

يقوم هذا الفصل على تقديم دراسة تحليليّة للصوت اللغوي. وذلك من خلال 
الاتكاء على نتائج التحليل التقني لأصوات اللغة» إلا أن تلك الدراسة لم تكن منبتة 
الصلة عن جهود علماء العربية الذين قدموا وصفًا تفصيلا لأصوات اللغة العربية بغية 
الحفاظ على النطق العربي من اللحن أو التبديل؛ فلقد كانت «جهود علاء العربية مثل 
الخليل وسيبويّه وابْن جني في دراسة الأصوات اللّغوية يشار إليها دائ) في عصرنا على 
أنها من الإنجازات المتميزة في الدرس اللغوي, وقامت حوا دراسات ليست قليلة». 

وسوف يقومٌ الباحثٌ في هذه الفصل بمعالجة الدراسة التحليلية للصوت اللغوي 
من خلال محورين رئيسين: 

١‏ - أوهما يتناول تحليل الصوت اللغوي. 

؟- والآخر يتناول آليات التنفيذ» وإعداد قاعدة البيانات الصوتية. 


-١‏ تحليل الصوت اللغوي 

١١-الصوت‏ اللغوي 

ذهب الراغب الأصفهاني إلى أن «الصوت: الهواء المنضغط عن قرع جسمينء وهما 
ضربان:صوت مجرد عن تنفس بشيء كالصوت الممتد» وتنفس بصوت ما. 

والمتنفس نوعان: غير اختياري كما يكون من الجادات والحيوانات» ونوع اختياري 
كما يكون من الإنسان» وهو ضربان: 

ضرب باليد كصوت العود وما يجري مجراه. 

» ضرب بالفم في نطق وغير نطق. 

فالمنطوق منه: إما مفرد من الكلام» وإما مركب كأحد الأنواع من الكلام. وغير 
النطق : كصوت الناي». 


وذهب ابن سينا إلى أن «الصوت تموج المهواء ودفعه بقوة وسرعة من أي سبب كان». 


-م+- 


هذه الطبعة إهداء من المركز 
ولا يسمح بنشرها ورقيا أو تداولها تجاريا 
:ا ييا 


أما ابن جني فقد ذهب إلى أن الصوت اللغوي «عرض يخرج مع النفس مستطيلاً متصلا 
حتى يعرض له في الحلق والفم والشفتين مقاطع تثنيه عن امتداده واستطالته» فيسمى 
المقطع أينا عرض له حرقاء وتختلف أجراس الحروف بحسب اختلاف مقاطعها». 

«وقد ثبت علميًا أن الصوت اهتزازات محسوسة في موجات الهواء» تنطلق من جهة 
الصوتء وتذبذب من مصانعه المصدّرة له» فتسبح في الفضاء حتى تتلاشى» يستقر 
الجزء الأكبر منها في السمع بحسب درجة تذبذبهاء فتوحي بدلائلهاء فرحًا أو حزنّاء مهيا 
أو أمرّاء خبرًا أو إنشاءً» صدى أو موسيقىء أو شيئًا عاديا مما يفسره التشابك العصبى في 
الدماغ» أو يترجمه الحس المتوافر في أجهزة المخ بكل دقائقها». وتتم عملية إنتاج الصوت 
عبر ما يعرف بالجهاز النطقي «الذي يتمثل في «الرئتين ولسان المزمار والرقيقتين أو 
شان الفرقيين والآلاف والقي بابجراتة». 

فالصوت يمثل الصورة الواقعية للغة التي يرى «دي سوسير» أنها «كيان عام يضم 
النشاط اللغوي الإنساني» في صورة ثقافة منطوقة أو مكتوبة» معاصرة أو متوارثة» 
وبعبارة أخرى كل ما يمكن أن يدخل في نطاق النشاط اللغوي من رمز صوتي أو كتابي 
أو إشارة أو اصطلاح فهو من قبيل اللغة» التي إما أن تكون في صورة منظمة ذات 
قواعد وقوانين» وذات وجود اجتماعى فيطلق عليها اللسان» وهى اللغة المعينة التى 
نيد موضر عا للدراسة مكل الحرية أى الاتكلبوية وإنا أن كرون ذا ضور عاية فى 
العقل الجمعي ويطلق عليها اللغة». 

وني المعجم الوسيط: «الصوت كل ما يسمع؛ وسببه تموج الحواء نتيجة لقرع أو قلع 
أو نحوهما) [مادّة: ص وو ت]ء ويرى الدذكتور محمد أحمد كاملء في كتابه (العلوم وحياة 
الإنسان) أنْ «الإحساس في الأذن بالطاقة الميكانيكية الناتجة من اهتزاز الأجسام في 
مجال التردد من ٠١‏ إلى 7٠٠٠٠١‏ ذبذبة في الثانية» ويصدر الصوت عند اهتزاز الأجسام 
نتيجة لتأثرها بالطاقة الحركية أو المغناطيسية أو الكهربية مثل الشوكة الرنانة أو الآللات 
الموسيقية» أو اهتزاز الثنايا الصوتية بالحنجرة أو الجرس الكهربي» وتنتقل الموجات 
الصوتية في الوسط المحيط بالجسم (المواء مثلا) في صورة كرات من الانضغاط (تتقارب 
الجزيئات من بعضها) تتبعها كرات من التخلخل (تتباعد الجزيتات عن بعضها). 
وتتكون الموجه الواحدة أو الذبذبة من انضغاط كامل + تخلخل كامل» ويعتبر طول 


- 


الموجة طاع11/21:6162 هو طول الذبذبة الواحدة» أو هو المسافة بين مركزين متضاغطين 
متتاليين أو مركزين متخلخلين متتاليين» . 

"١‏ - سرعة الصوت (0صناه؟ 02 0أءءم5) 

هي سرعة انتقال الطاقة الصوتية في الوسطء وهي ثابتة في الوسط الواحد بصرف 
النظر عن نوع الصوت وتردده» ولكنها تختلف من وسط إلى آخر فتتغيّر طبقا لكثافة 
الوسط وإعاقته للصوت ودرجة الحرارة» وخصائص الوسط التى تحدد سرعة الصوت 
هي الكثافة وقابلية الانضغاطء والكثافة هي مقدار الكتلة الموجودة في وحدة الحجم 
من المادة» وتقيس قابلية الانضغاط مدى سهولة كبس المادة في حيز ضيق. وكلما زادت 
الكثافة وزادت قابلية الانضغاط» قلت سرعة الصوت. وتزداد سرعة الصوت في 
السوائل عن الغازات وفي الأجسام الصلبة عن السوائل؛ وذلك لتقارب الجزيئات بهاء 
فالسوائل والأجسام الصلبة بصفة عامة أكثر كثافة من المواء» وهي أيضًا أقل من المواء 
بكثير في قابلية الانضغاط. ولذلكء. فإن الصوت ينتقل بسرعة أكبر خلال السوائل 
والأجسام الصلبة. 


١.و"-‏ الموجة الصوتية (75856 0دده8) 

هي أحد أشكال انتقال الطاقة» وتتحرك الموجات في وسط مادي 7“ حيث تنتقل فيه 
الوحات تقال الطافة دن كان ل اكتريدوة إرالسر فاك الوسط بشكل دائم» أي 
أنه لا تنتقل أي كتلة مع انتقال الموجة» ولكن جزيئات الوسط تتحرك بشكل متعامد 
أو مواز لاتجاه حركة الموجة حول موقع ثابت. وللموجات صفة الدورية» فتكون عادة 
تكرارا لنمط ما من الشدة في فترات زمنية متتابعة» ويسمى عدد الموجات المارة في مقطع 
ما مقسوما على وحدة الزمن التردد. وتسمى المسافة الأفقية التي تقطعها الموجة الواحدة 
طول الموجة؛ وهو أصغر جزء متكرر مكون للموجات. ويساوي المسافة بين قمتين أو 
قعرين متتابعين» أو هو المسافة المحصورة بين ٠"‏ قيم صفرية متتابعة للموجة» ويوضح 
الشكل )١-7(‏ رسا تخطيطيا لطول الموجة. 


-١‏ باستثناء الموجات الكهرومغناطيسية وبعض أشكال الجزيئات الكمّية ذات الخصائص الموجية. 


-/19ا- 


هذه الطبعة إهداء من المركز 
ولا يسمح بنشرها ورقيا أو تداولها تجاريا 
بر 6ط طغسسسييا 


طم طول الموجة 
3 المطال 


جا 


لال 


جلب المسافة 
الشّكل 1-7: رسم تخطيطي لطول الموجة. 

وصفة الدورية للموجة عبارة عن التردد أو التواتر» وهو مقدار تكرر الموجة الواحدة 
ذات الطول الموجي المتفق عليه في كل وحدة زمن. 

وتكون درجة الصوت أعلى كلما كانت الذبذبات أسرعء وكلما زادت سرعة هذه 
الذبذبات كان الصوت دقيقًا أو حاداء ومن ثم فإن الصوت يكون سميكًا إذا قل 
عدد الذبذبات في الثانية الواحدة. «فالفرق بين شوكة رنانة ذات درجة صوتية عالية 
وأخرى ذات درجة صوتية منخفضة أن الأولى تعمل عددًا أكبر من الذبذبات في الثانية 
الواحدة». ويقاس التردد بعدد الذبذبات التي تحدث في الثانية الواحدة». 

وإذا كان تردد الصوت (ل©معناوع1 501ن37)501“: هو عدد الذبذبات أو الموجات 
الكاملة في الثانية الواحدة فإنه يمكننا رصد هذا التردد كما في الشكل (5-75) الذي 
يعرض لموجة صوتية ذات تردد مرتفع وأخرى ذات تردد منخفض. 


الوقت-ى < ل ىب حى حي حي حم | لضغط 
إحدورة حم 
موجة صوتية ذات تردد منخفض 
الوقت الضغط 
تج دورة م 
الشكل 7-؟: موجة صوتية ذات تردد مرتفع (صوت رفيع) وموجة صوتية ذات تردد منخفض 
(صوت غليظ). 


١‏ - وحدة تردد الصوت هى هيرتز (116112 أو 112 أو ذبذبة/ ثانية). 


-/- 


ونلاحظ هنا أن التردد يتناسب عكسيا مع طول الموجة» أي كلما زاد التردد قصر 
طول الموجة» أي: التردد 1٠٠١‏ هرتز له طول موجة أقصر من التردد 05٠١‏ هرتز. 

ويعتبر التردد من العناصر التى تؤدي إلى إدراك بعض الأصوات وتمييزها؛ حيث 
لوؤدي اكذاواف ارده تويعانه ينضن الأمترات اللغوية إن كين [دراكهاء فالصيرت 
/ س/ ذو تردد عال يفوق 5٠0٠١‏ هرتزء فإذا انخفض تردده ليقترب من 70٠١‏ هرتز 
فإن السامع يدركه / ش/». 


ويمكن رصد العلاقة بين التردد والشدة من خلال الشكل (7-”7) الذي يعرض 
رسا تخطيطيا لرصد العلاقة بين التردد والشدة لموجة مفردة. 


الشدة 


التردد 
الشّكل 7-: رسم تخطيطي يرصد العلاقة بين التردد والشدة لموجة مفردة. 


١,؛‏ - التردد الأسامي 

هو أحد العوامل التي ١يمكن‏ عن طريقها إنتاج أصوات يختلف الواحد منها عن 
الآخر' وحين تسمع أي صوتين يمكن أن تقارن| من هذه الجوانب المختلفة» مثل 
شوكة رنانة وأرغن» فهما يصدران صوتين مختلفين نتيجة عامل أو أكثر». 

ويعبر شكل الموجة عن قيم شكل الموجة أو التردد الأسامي لهذا الصوتء فالصوت 
ينظر إليه عادةً على أنه عمليّة فيزيائية مادّيّة تتكوّن من جزأين أساسيين: 


* منتج حقيقي للصوت؛ ويمثله الحبلان الصوتيان. 


-١‏ بمعنى أنه يمكن عن طريقها تمييز صاحب الصوت مع تشابه الصوتين. 


-94- 


هذه الطبعة إهداء من المركز 
ولا يسمح بنشرها ورقيا أو تداولها تجاريا 
|ٌُ:ا ب الل ييا 


٠.‏ مشكل للصوت؛ وهو عبارة عن منتج مساعدء يقتصر دوره على إتمام عملية 
التوجيه واكتساب الصفات التمبيزية» وتمثله باقى أعضاء النطق مثل: اللّسان 
والشّفاه والأسنان... إلخ. 
وتحاول عملية تحليل التنغيم رصد هذا التردد الأسامبي للصوت المنطوق. 
وهناك عدّة قواعد لمعرفة التردد الأساسي تخلص إلى أنه العنصر الأقوى الذي يجعلنا 
ندرك علاقة التلازم بين الصوت وصاحبه؛ فبمجره أن نسمع جملة نعرق قائلها بسبب 
معر فتنا لتنظيمه. #ويمكن أن تميز صوئًا عن ضوت آخر بشكل الموجة الت تنح كلا 
منهماء وليس شكل الموجة مقياسًا بالمعنى الدقيق» ولكنه مجرد وسيلة لتمييز الأصوات 
بتحليلها إلى الموجات التي تتكون منها». 

وتظهر معام التردد الأسامي على هيئة منحنيات أفقية موازية لخط الزمن» وتكون 
أكثر وضوحًا مع الأصوات المجهورة؛ حيث يبتر الحبلان الصّوتيّانَء وتتواجد القيم 
لهذه الحزم بين 3٠5-٠١‏ هرتز بالنسبة للمتحدثين الذكور. وتتزايد هذه القيمة مع 
الإناث لضيق الحنجرة عن حنجرة الذكورء وقلة سمك الأحبال الصوتية؛ فتبلغ قيمة 
هذه الحزم مع الأنثى البالغة 0٠0-١65٠‏ هرتز. ويوضح الشكل (5-7) منحنى التردد 
الأسامى لكلمة مفردة. 


الشّكل ؟-:: منحنى التردد الأساسى لكلمة مفردة. 


في هذه الصورة تتواجد قيم التردد الأسامي بين ٠٠١‏ و ١5١‏ هرتزء والصورة عبارة 
عن رسم طيفي لكلمة «فوناتيك» بصوت ذكر بالغ» ونلاحظ أن التردد الأسامي في 
المقطع الأول أعلى منه في المقطعين الثاني والثالث» ويظهر الشكل (2-7) منحنى التردد 
الأسامي لجملة خبرية. 


دولا 


001 (1.01) تلقمقعة 


الكل 5-7 مفدض النروه الآسابى خيلة خرية: 
ويعرض الشكل صورة طيفية لجملة خبرية تمثل النغمة الحابطة؛ حيث يبدأ فيها 
التردد الأسامبي منخفضًا ثم يزداد في منتصف الجملة ليصل إلى أقل انخفاض في خباية 
الجملة» والجملة هي قوله تعالى:بنْسَما اشْتَرَا اكور ادر ]. 


الشّكل 5-7: منحنى التردد الأساسي لحملة استفهامية. 


ويعرضص الشكل (؟5-5) صورة طيفية لحملة استفهامية تمثل النغمة الصاعدة» 
جدام ديا اباد تو عل للق الالتقاضي الذي ررا ناه ل عي ملح 


0 الأساسي 5 الشكل السابق» والحملة هي قوله تعالى :قل الذكرَينٍِ حَرَّمَ مَأم 
نتييّن #[الأنعام/ 57 .]١‏ 


الاب 


هذه الطبعة إهداء من المركز 
ولا يسمح بنشرها ورقيا أو تداولها تجاريا 
:ا ييا 


١‏ ,» - شدة الصوت (واتوسمعغصةذ لسبدو5) 

هي قياس كمية الطاقة الصوتية لصوت ما بالنسبة إلى كمية طاقة صوتية ثابتة 
تستخدم كمر جع ويتم القياس بطريقة لوغارتمية» وتسمى وحدة شدة الصوت 
«الديسيبل» (0601561) واختصارها 08. ومن أهم أنواع الديسيبل: 

ديسيبل ضغط الصوت (1م168761085 عتتناووعام لصناه5 08) . 

* المرجع الثابت هو طاقة صوتية قدرها ٠, ٠٠٠7‏ داين/ سم". 

» وتحسب شدة الصوت كالآتى - ٠١‏ لو (الطاقة الصوتية المراد قياس شدتها + 

الطاقة الصوتية المرّجع). 

فمثلا إذا كانت طاقة صوتية قدرها؟٠ ٠,‏ داين/ سم”؟ فإن شدة الصوت بها 

0 <الو(؟7 -)0,:0١5+ 0,٠‏ 508 لو 585١-1١١١‏ - ٠غ‏ ديسيبل. 

حيث: الداين: هو وحدة قياس الضغط .]١١[‏ ومقداره ٠٠٠١/١‏ من الجرام» 
«وضغطة موجة ما هو عبارة عن عدد الداينات التي تضغط على مساحة سنتيمتر مربع 
واحد» .]١١[‏ 

والديسيبل هو وحدة شدة الصوت وهو وحدة ليس لا تمييز؛ لأنها نسبة بين كميتين 
من الطاقة» وهو الأساس لقياس كل الأصوات في الطبيعة أكلام» ضوضاءء أصوات 
حيوانات وغيرها- ويتم قياسه عن طريق جهاز قياس شدة الصوت. 

ويمثل الديسبل «مقياسًا عمليًا لقوة الصوت وضغطه. والديسيبل ٠١/١‏ بيل» 
والبيل هو ضغط أضعف صوت تدركه الأذن الإنسانية» .]١1١[‏ 

وتقاس شدة الصوت «بأجزاء من عشرة آلاف مليون مليون من الوات في السنتيمتر 
المربع» وتبلغ قوة أضعف صوت تسمعه الأذن جزءا واحدا من عشرة آلاف مليون 
مليون وات سنتيمتر مربع» .]١١1[‏ 


الات 


"١‏ - الرّسم التَذِبذِيٌ (شكل الموجة) 

يعرف الصوت فيزيائيًا بأنه سلسلة لتغييرات الضَّغط في الوسط بين المرسل 
والمستقبل. فالصوت هو: «اضُطْرَابٌ مَادِيٌّ في ال مواء يتَمََلّ في فوَّةِ أو ضَعْفٍ سَرِيِعَيْنِ 
للضّعْطٍ المتَحَرّكِ من المضْدَرٍ في اتجاه الخارج» ثم في صَعْفٍ تَذرِيجِيّ إلى قط الزّوَالٍ 
النْهَائِيّ) [7075]. فالمرسل عندما يبدأ عملية إصدار الصوت فإن الصوت الخارج 
منه يقوم بالضغط على الحواء في شكل موجات متلاحقة تصطام بالمستقبل ١‏ ميكرفون 
أو أذن مثلًا- فتحدث عملية التخلخل التي تصاحب الضغطء وأكثر الأمور شيوعًا 
لتمثيل معالم الصوت الحسية ورصدها هو الرّسم التذبذبيّء الذي يطلق عليه الشكل 
الموجي. ويمثل المحور الأفقي فيه محور الزّمن وتتم قراءته من اليسار إلى اليمين بين 
يمثل المنحنى الرأمى قوة هذا الصوت في لحظة معينة» في الوقت الذي تظهر فيه عدد 
الترددات الذبذبية الحفلة الواحدة على هيئة تتابع وتلاحق هذه الخطوط الرأسية لهذا 
لمحو 

فعندما ننطق أية كلمة (دفقة صوتية واحدة) في البداية سيتم التنفس من الرثتين 
ثم يخرج الهواء إلى الحنجرة الذي قد يسبب عند مروره بها اهتزاز الحبلين الصوتيين 
ويستمر في مسيره حتى يصل إلى القناة الصوتية وينتقل منها إلى التجويف الفموي”'"'. 
وبعدها تخرج الكلمة وتصبح مسموعة وتتحول إلى شكل الموجة. ويظهر الشكل (؟5- 
/ا) صورة للرسم التذبذبي من خلال برنامج 110 ]لل 0001. 


التردد 
الوقت 
الشّْكل :7-١‏ صورة للرسم التذبذبي (شكل الموجة)» كما يعرضه برنامج 8,0 11014 001©. 


من الشكل (72-7) يمكن تحليل صوت الفاء بأنه صوت استغرق ١١5‏ ميلل 
ثانية”"©» وهو صوت عالي التردد ٠٠١‏ هرتزء ضعيف الإساع. بينا تمثل النون قوة 


.)02531 3:167/( وفي الأصوات الأنفية يضطر المواء للمرور بالتجويف الأنفي‎ -١ 
من الثانية وفي الأصوات الأنفية يضطر الحواء للمرور‎ ٠٠٠١ /١ ويعنى ميللى ثانية‎ 2.٠٠٠١ /١ كلمة ميل 1/1111 تعنى‎ - ١ 
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هذه الطبعة إهداء من المركز 
ولا يسمح بنشرها ورقيا أو تداولها تجاريا 
:ا ييا 


الإسماع 0 0 هرتزهء مع ترددات متوسطة ٠‏ ذبذبة» وقد استغرق هذا الصوت 0ه 
ميللي ثانية. 

أما صوت الدال فهو منخفض الترددات» ومنخفض الإسماعء وقد استغرق ١7١‏ 
ميللي ثانية. وبالنظر إلى الشكل (6-7) نرى إحداثيات شكل الموجة من خلال المحورين 


السيني والصادي. 
الشدة او الطاقة 
«9ا||٠‏ التمثيل الموجي 
الوقت 


الشّكل 6-7: وتظهر فيه إحدائيات شكل الموجة حيث المحور السيني هو الوقت 
والصادي يمثل الشدة. 


١‏ و7 - علم الأصوات وطرق التحليل الصوتي 

الفوناتيك هو جزء من علم اللغة» إنه معني بدراسة الحدث الناتج بواسطة الأعضاء 
الصّوتيّة البشريّة» ويعنى بالأخص بدراسة الحدث اللغوي الذي يُسْتَخْدَّم في الكلام 
البشري» ويعد التحليل الطيفي للأصوات من أهم جوانب البحث الصوتقي» وهو 
الجانب الذي يُشّار إليه كثيرًا بالجانب الصوتي التجريبي» أو التحليل الميكني للصوتيّات 
البشرية. ْ ْ 

ويتم التحليل الصوتي (21020108162[22217515) بواسطة أداة أو أكثر من الأدوات 
المتاحة لهذا الغرضء ومن بينها أفلام أشعة إكس (06_1839)» وأنابيب جريان الهواء 
(طمتع همطء0]2نتتاعصط6)» والكيموجراف (50م13:2208173)» والإليكتروميوجراف 
(طمهزةع11601501270)» والإسبيكتر وجراف (661081301م2)5»: واللارينجوجراف 
(أمةاع 15:050ة.1) » ورسام الحنك الإلكتروني (طمةمع 21210م متاءعع81).. إلخ. 


بالتجويف الأنفى (#طتتكةء 1[وقهم). 


-5/ا- 


وهدف كل هذه الأجهزة والآدوات إظهار المعالم الحسية للصوت بشكل ماء 
بالإضافة إلى محاولة رصد بعض جوانب تلك الإشارات أو المعالم الحسية للصوت 
البشري على هيئة صورة يمكن طبعها على الورق أو رصدها على شاشة كمبيوتر. 

والكمبيوتر اليوم هو من أكثر الأدوات سهولة واستخدامًا؛ فعن طريقه تعد عمليّة 
التّحليل الصوتي أبسط كثيرًا وأسرع عادةً إذا ما قورنت بالأدوات الأخرىء مع الحفاظ 
على جودة النتائج» وإمكانية جمع كل الأدوات في برنامج واحد. 

6١‏ - الصورة الطيفية (سةرومممءءم5) 

نستطيع تمثيل الصوت اللغوي عن طريق الصورة الطيفية وهي ذات ثلاثة أبعاد: 
الوقت» والتردد» والشدة» ويمثل المحور الأفقييٌ في الصّورة الطيفيّة منحنى الزّمن 
بالملل ثانة :رمقل الكزدة التحور الراني بالميزتره آما لبعد لالت وهو مدي الارةد 
أو شدة الصوت فَيُمثّله قرب أو بعد لون الصورة عن لون الخلفية. وقد تعتبر الصضورة 
الطّيفيّة عددا من السّلاسل المتوالية إذا نظرنا إليها من أعلى (مسقط أفقى)؛ حيث مُكل 
الزّيادات أو القمم الرأسية في الصور الطيفية بالبقع المظلمة في الصّورة الطَيفيّةه وكلتاهما 
تعبر عن شدة الصوت المنطوق. 

ويعد جهاز المطياف من أفضل الأجهزة التي خدمت الصوتيات الأكوستية إن لم يكن 
أفضلها على الإطلاق» حيث يقوم بعرض صورة مرئية للنطق تكشف عن خصائص 
الكلمة المنطوقة» وهو يفيد في معرفة صفات الأصوات اللغوية وترجيح أوجه الخلاف 
في وصف بعض الأصوات التي دار حوها الجدل قدي وحديثًاء «ونظرًا لأن موجات 
الصوت اللغوية من النوع المركب فإن عرضها باستخدام جهاز عارض الذبذبات لا 
يقدم كل التفاصيل عن الموجة الصوتية. بين يقدم المطياف ثلاثة أبعاد للموجة المرسومة 
وهى: التردد» والشدة» والزمن. وهذا يعين الباحث في معرفة زمن الصوت. والتردد 
الآسامى» والنطاق الرنيتي وشدته» ولذا فإن معظع دراسات أكزسعة الصوت اللغوية 
تعتمد على المطياف بشكل أو بآخرا [١؟].‏ 

وبالنظر إلى الشكل (4-7) نرى صورة طيفية مأخوذة من المطياف توضح الأبعاد 
الثلاثية للصوت المنطوق. 


-ه/ا _- 


هذه الطبعة إهداء من المركز 
ولا يسمح بنشرها ورقيا أو تداولها تجاريا 
+ ل لغ غ سيا 


الوقت 


الشّكل 4-7: صورة طيفية مأخوذة من المطياف توضح الأبعاد الثلاثية للصوت المنطوق. 


من الصّورة يتضح لنا اختلاف طبيعة الأصوات المنطوقة حسب معطيات الصورة 
الطيفية» ففى الحرف الاحتكاكيٌ المهموس نجد أن الطاقة مركرة بكثرة في نطاق التَّرَدّد 
أو الشزهو نوضري ]بح ما (شبيه بالشوضاء) فق مظيره: آما'ق .باق الأضرات 
الملهموسة-الانفجارية على سبيل المثال-فإن هذه الأصوات تتكوّن من فترة صامتة حتى 
تظهر الطّاقة فجأة وبقوة في نطاقات التَّردّد أو الحزم» على هيئة انفجار. 

وتبدو الأصوات المجهورة أكثر تنظيًاء وتبدو أعلى السّلسلة (البقع المظلمة) في 
الواقع على هيئة خطوط في وضع أفقيّ الشّكل عبر الصّورة الطيفيّة» وتمثل هذه الحزم 
الذبذبات؛ حيث يعطي شكل الفم رنين الصوتء هذه الحزم تُسَمّى المعالم» ويتم ترقيمها 
من الأسفل إلى الأعلى على هذا النحو ف١‏ ف١‏ ف" أو 8١‏ 7 77 إلخ؛ وتختلف 
مواضع هذه الحزم باختلاف نوع الصوت المنطوقء ومن الممكن تحديدها بشكل تقريبي 
مع كل فوليم: 

فهذه الحزم الصوتية التي يطلق عليها المعالم هي «الترددات أو مجموعة الترددات 
التي تشكل نوع الصوت وتميزه عن الأصوات الأخرى ذات الأنواع المختلفة» [١؟].‏ 

ومن خلال الشكل )2١-5(‏ نرى صورة طيفية توضح أبعاد الحزم الصوتية 
للحركات القصيرة. 


لكات 


الما انالا 


التد دد 


01 


الشّكل ٠١-١‏ : صورة طيفية توضح أبعاد الحزم الصوتية للحركات القصيرة» مصدر الصورة: 
موسوعة ويكيبيديا. 

١‏ الكتابة الصوتيّة 

تمثل الكتابة العادية طريقة واحدة للتعبير عن الأصوات عن طريق مجموعة من 
الرموز الكتابية. فإذا كانت اللغة عبارة عن «أصوات يعبر مها كل قوم عن أغراضهم) 
فإن الكتابة هي رموز يعبر بها كل قوم عن أصواتهم» وتقوم الكتابة على نظام رمزي 
صوتي» «ومهمة هذا النظام أن يزودنا بالرموز التي يمكن أن نعبر بها عن القيم الصوتية 
المختلفة للمواد اللغوية في لغة ما» [؟؟]. 

لاقبنن اتلتضاكضن العالبة للنة الحاظر رين الخرك والصوت» ييخ المجاء والتطق» 
الذي توافق عليه علماء اللغة والأصوات» [7"]» وقد عد سابير اللغة العربية من 
اللغات الخمس الوحيدة الحاملة للحضارة الإنسانية والتي يسهل إدراجها 35 نظام 
الكتابة الصوتية العالمية. 


-/ا//لا ا 


هذه الطبعة إهداء من المركز 
ولا يسمح بنشرها ورقيا أو تداولها تجاريا 
:ا ييا 


ومنذ فترة ليست بالبعيدة استطاع علماء الأصوات أن يبتكروا ألفبائية جديدة للتعبير 
عن الأصوات المختلفة. وتحاول هذه الألفبائية الحفاظ على قرب العلاقة بين الرموز 
الكتابية والضّوت المنطوق. وتعتبر الآلفبائية المستخدمة على نطاق واسع هي: 124 
أو (مههأءمدهة عتأعدمطط لهمه1همرعام1). وهو اسم جمعيّة صوتيّة دوليّة نشأت 
أواخر القرن التاسع عشرء وكانت المراجعة الأخيرة لها في عام 944١م.‏ ويعمل نظام 
104 على إيجاد رمز لكل فونيم في كل لغة بشريّة» ووضع علامات تشكيلية للتَِّيّرات 
التى تعتري أية لغة من اللغات. 

وقد قسمت هذه الجمعية اللغوية الأصوات الإنسانية إلى ستة أقسام» هي : 

* رموز لأصوات صامتة رئوية. 
* رموز لأصوات صامتة غير رئوية. 
» رموز لأصوات صائتة (الحركات). 
رموز لأصوات نغمية. 

*؟ رموزلعلامات تمييزية. 

* رموز الفوقطعيات. 

ثم تطورت فكرة هذه الألفبائية» واكتست ثويًا جديدًا يتوافق مع سهولة التعامل مع 
الحاسب الآلي؛ بحيث يجد كل رمز صوتي مكانًا له على لوحة المفاتيح بالجهازء وقد تم 

(64 تاماخ عتأعطمطاط ملمطاع]/ظا أمعمرووعودخى اعععم5 - خط ]/لخد) 


فجمعت الرموز الصوتية العربية على النحو المبين في الجدول :)١-7(‏ 


-//ا- 
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الجدول ١-7‏ : الأصوات العربية. 


-4/ا- 


هذه الطبعة إهداء من المركز 
ولا يسمح بنشرها ورقيا أو تداولها تجاريا 
:ا ييا 


- آليات التنفيذ. وإعداد قاعدة البيانات الصوتية 
يمكن تفصيل نقاط البحث في هذا المبحث إلى: 

7 - أجهزة التحليل الصوتي 

؟,؟ - الأدوات والبرامج التحليلية الحاسوبية 


5- أجهزة التحليل الصوتي 

اعتمدت الدراسات الصوتية ة في التراث العربي على قدر كبير من الملاحظة المباشرة 
امو نا ار ار لص وا عب الى اتيج 
التجريبي في شتى يجالاات البحث العلمي حدث تطور كبير في آليات معالحة هذه 
الدراسة «واستخدم علم الأصوات مكل القرن التاسع عشر الأجهزة الدقيقة سواء 
الفسيولوجيا والفيزياء وال هندسة الكهربائية ومعالجة الكلام وطب الأسنان وغيرها» 
[. فقد أصبحت الصوتيات علا معمليًا (يعتمد على التجارب التى بدورها تعتمد 
على معامل مجهزة تجهيرًا حديئًا يواكب التطور العلمى والتقنى الذي نعيشه. وهناك 
أجهزة تخدم فروع الصوتيات الثلاثة: النطقية والأكوستية والسمعية» فيمكن متابعة 
وضع تجارب واستخدام أجهزة دقيقة؛ لمعرفة الكيفية التي تتم بها عمليتي السمع 
لحار هذا لكر من اليد كل الاح الي تر وبال ود ليم 
الصوتيات 7120261105 دقيقة لدرجة كبيرة و7 تتمتع بالثبات والموضوعية» [١؟7].‏ 

وسوف يعرض الباحث فيا يلي لأهم الأجهزة | لمستخدمة في ال: لتحليا الصوي: 


* جهاز الرسم الحنجري (طمرة تع 131:7250) 

«وهو جهاز إلكتروني يمكننا من استنتاج حالتي الفتح والغلق للآوتار الصوتية عن 
طريق تسجيل اتجاه التيار من أحد جانبي الحنجرة إلى الجانب الآخرء ويمكن تحويل 
هذا التسجيل إلى صوت يمثل نتيجة عمل الأوتار الصوتية دون تأثير أي رنين صادر 
عن القناة العلياء ىا لو كنا قد فصلنا تجاويف ما فوق الحنجرة» وسمعنا ذبذبة الأوتار 
الصوتية بدونها») .]7١[‏ 


دو ب 


" مقياس التنفس (اعاع درم تمدع +1 عاعسرمرزمة) 

يفيد هذا الجهاز في قياس مقدار وقوة واتجاه هواء الزفير» والجهاز عبارة عن خرطوم 
مطاطي متصل بجهاز قياس» حيث يوضع الأنبوب المطاطي في فم المتحدث مع إغلاق 
فتحتي النيشوم, فيقوم الجهاز برصد مقدار وقوة واتجاه التنفس. 

" مقياس انسياب المحواء لطم ع مطعة)متسعمط) 

فائدة هذا الجهاز قياس مدة انسياب هواء الزفير الخارج من الأنف والفم معًا أو كل 
على حدة» والجهاز عبارة عن كيامة توضع حول الفم والأنف مع وجود عازل بينهما» 
وتتصل هذه الامة بجهاز قياس فترة خروج المواء. 

ويفيد الجهاز في «معرفة حجم المواء الخارج من الجهاز الصوتي مع كل صوتء 
وعلاقة حجم المواء مع الأوضاع المختلفة للجهاز الصوتي. فمن المعلوم أن حجم الحواء 
الخارج من الجهاز آثناء نطق / ز/ أقل من ذلك المصاحب للصوت / س/ » حيث إن 
الرقيقتين الصوتيتين تعيقان انسياب المواء في الأول فيقل حجم المواء الخارج» وذلك 
بعكس ما يحدث أثناء نطق / س/ » ويمكن بواسطة هذا الجهاز معرفة ما إذا كان 
الصوت أنفيًا أم فمويًا أم أنفمويّك وذلك بتتبع حجم المواء الخارج من الفم والأنف 
أثناء نطق الصوت موضع الدراسة» [1١؟].‏ 


" منظار الحنجحرة أو المجهر الحنجري (13172505600) 

يقوم هذا الجهاز برصد حركة الأوتار الصوتية» وهذا المنظار عبارة عن مرآة مستديرة 
قطرها بوصة» ويوضع هذا المنظار في فم المتحدث فيعكس صورة الأوتار الصوتية» 
ويبين إذا كان الصوت المنطوق مهموسًا أو مجهورًا. «ويعيب هذه الآلة أنها تتدخل في 
سير الكلام الطبيعي» وأنها لا يمكن استعالها إلا في حالات محدودة» .]7١[‏ 

" مجهار العضلات (7طجره ندعم توسدمتناء»1:1) 

يفيد هذا الجهاز في رسم إشارات تعبر عن حركة العضلات المصاحبة لعملية النطق؛ 
حيث يقوم بقياس الشحنات الكهربائية الصادرة من المخ التي تؤدي إلى تناغم ما يزيد 
عن مئة عضلة في الجهاز الصوتي؛ لتوليد الصوت الإنساني بشكل سلس. 


-/ا١-‎ 


هذه الطبعة إهداء من المركز 
ولا يسمح بنشرها ورقيا أو تداولها تجاريا 
:ا ييا 


" الأشعة السينية (1289 _)3) 

تقوم هذه الأشعة بتصوير أعضاء الجهاز الصوتي أثناء قيامه بعملية إنتاج الكلام» 
فهذه الأشعة «تسمح بدراسة كل موقع لأي عضو من أعضاء الكلام عند أي نقطة أثناء 
الكلام» وهناك كذلك الصور المتحركة لأشعة إكس التي تسجل حركات هذه الأعضاء 
أثناء النطق» ومن الممكن مصاحبة هذه الأفلام بتسجيل صوتي حتى يمكن أن تستمع 
إلى الصوت وتشاهد الحركات التي تقوم بها أعضاء النطق أثناء إحداث هذه الأصوات» 
.]٠١[‏ وقد اتجه العلماء حديثًا إلى استخدام الأشعة السينية المنخفضة لتفادي الأضرار 
الناتجة عن تعرض الجهاز الصوتي للآشعة السينية لفترة طويلة. 

0 سام الحنك الإلكتروني (طمهعه)12هممسماء»81) 

يستخدم هذا الجهاز في رسم الحنك حال نطق الأصوات بطريقة إلكترونية» والحنك 
هو التركيب الفاصل بين جوف الأنف وجوف الفمء فهو سقف الفم وأرضية الأنف. 
ويمتد الحنك نحو الخلف ليفصل جزئيًا بين التجويف الأنفي والتجويف الفموي» 
للحنك شكل القبة ويتألف من قسمين هما الحنك الصلب الذي يشكل الجزء الأمامي 
والحنك الرخو الذي يشكل الجزء الخلفى منه» ويمثل الحنك الصلب الجزء العظمي من 
انلك ويشكل الفلفيق اللأملنيين مضو رتالف هن النافين المتكون للعطيق الفكييت 
العلويين في الأمام ومن الصفيحتين الأفقيتين للعظمين الحنكيين في الخلف. ويفصل 
الحنك الصلب جوف الفم عن جوف الأنف. 

أما الحنك الرخو أو الحنك اللين فهو الجزء الخلفي من الحنك «وهو عبارة عن 
طية ليفية عضلية متحركة ومعلقة بالحافة الخلفية للحنك الصلبء هذه الحافة الخلفية 
للحنك الرخو حرة وا في المستوى الناصف استطالة تدعى اللهاة) . 

ويقوم جهاز رسام الحنك الإلكتروني برسم «أجزاء الحنك التي يلامسها اللسان 
أثناء الكلام كل ٠٠١/١‏ من الثانية - ٠١‏ ميلل ثانية. يتكون الجهاز من حنك 
صناعي مصنوع من البلاستيك ويحتوي على 14 حالبًا- يزيد عددها أو ينقص حسب 
نوع الجهازء يتم تثبيت الحنك الصناعي في الفم ملاصقا للحنك الطبيعي وموصلا 
بحاسوب. أثناء التجربة» يعرض الحهاز الحوالب التى يلامسها اللسان أثناء التتحدث 
إما على الشاشة أو بالطابعة على الورق» [١؟7].‏ ْ 


--9؟:'ل/ ب 


"ان سام الحنجرة الإلكتروني رطمةمع هعم ننه[ مماء»81) 
«يتكون الجهاز من حالبين يوضعان على سطح الجلد المغطي لغضروف الحنجرة 
بحيث يقعان على الصفيحتين الغضروفيتين» يتابع الحالبان حركة تقارب الرقيقتين 
الصوتيتين أثناء إصدار الصوتء وتنقل الإشارة إلى جهاز عرض أو رسم. والجهاز 
يقيس تردد الرقيقتين الصوتيتين ونمط التردد» وله فوائد في تحديد ما إذا كان عمل 
الرقيقتين الصوتيتين طبيعي أم لا» [١؟1].‏ 
١‏ , 7- الأدوات والبرامج التحليلية الحاسوبية 
للقيام بعمل قاعدة البيانات يتعين على الباحث الاستعانة ببعض الأجهزة والبرامج 
الأساسية والأدوات المساعدة للخروج بأفضل عمل ممكن, وهي كالتالي: 
210 81011 0001 
(ممعأة2ز5 عمتلة7 اععءعءم5) 515 
15 01م لآلماط 


110 1001 1اع2100 1/1107 مع11100) 1111 

وفيها يلي إشارة وجيزة عن هذه الآليات وطريقة إفادته منها. 

" برنامج (5120 001:1511©) 

هذا البرنامج من أهم البرامج المستخدمة في إنشاء قواعد البيانات الصوتية؛ 
وذلك لقدرته على إظهار الصوت عل هيئة مرئية» تمكننا من ملاحظة الصوت بدقة. 
وإجراء التعديلات المناسبة عليه من حذف الزوائد لني تشوب الصوت ولصقها 
وتقطيعها وإزالتهاء وبه يتم تجهيز الصوت تجهيرًا محكً) حتى يصبح جاهرًا لأغراض 
المضغوط. ويفيد هذا البرنامج في عرض الصورة الطيفية للصوت المسجل» ى) يعرض 
لمستوى ذبذبات كل صوت وشدته ودرجة علوه أو انخفاضه. بالإضافة إلى إمكانية 
إدراج خلفيات للصوت وقياس صداه. ويعرض الشكل )١١-57(‏ صورة توضيحية 
للبرنامج. 


مرا 


هذه الطبعة إهداء من المركز 
ولا يسمح بنشرها ورقيا أو تداولها تجاريا 
!ار > ا لط ط ييا 


|57 اام عن سه 103 

ون ملسن به سير سيج هن .]| 

إرن العا إطان ك:. ناك نيزنا لي عد يكزن إمذلد ات 7 اخ امن عا إن يه اع | اليرذاب مياهلا البرمدرا 
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ع اداه" ذلك عت -206 401 


الشّكل :1١-1‏ صورة توضيحية لبرنامج 5120 :11011 00©. 
-15/0001ع010ع1-0110-1:01015-156خ/11010خ “111112013 /اعع /لححامء .019»ع ج01 1771717/.5//:ماخط 
لمطاططاء. 0]ط-1ل180 


5 بر نامج (سعاوروك عستلا طععءمك- 515) 

برنامج مستخدم حديثا في مجال تجهيز قواعد البيانات؛ حيث تم الاعتماد عليه 
مؤخرّاء وذلك في خطة تطوير الأدوات المستخدمة في بناء قواعد البيانات الصوتية» 
وبالنسبة لهذا البرنامج فقد أظهر كفاءة ملحوظة ني مجال تحديد بدايات ونبهايات المقاطع 
الصوتية تحديدًا دقيقَاه كا يتبح لنا هذا البرنامج مجالا خصبا للتعرف على صور مختلفة 
من مستويات الصوت من حيث الطاقة والقوة» ومن حيث الأداء الصوقي 
والحنجري والنبري للكلات المختلفة. ويعرض الشكل )١5-7(‏ صورة توضيحية 
لبرنامج 5155. 


حورت 


كم لاروع9 - بأو نزوو 


ماعنا بعتا ادحواة 0# ماع 
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الشّكل 17-1: صورة توضيحية لبرنامج 555. 
2.11/5 1ن .طم 


05 نامج (1001-5 521111 111ا1) 

برنامج ترجع أهميته الشديدة هنا إلى أنه يتيح لنا سماع الفونيمات كل على 
حدة مع ظهور الكتابة الصوتية لكل ملف من الملفات» ويظهر (66]0818502م5) 
وكذلك أيضًا (53110165)» وهما مَساران مهمان في تحديد مواضع الفونييات وتحريكها 
إلى أنسب المواضع» حيث تبدأ الفونيمات من أماكنها الصحيحة» | أن أي إجراء يتم 
على هذا البرنامج يكون تعديلا في ملفات 185 المهمة» كى) يمكننا البرنامج من تغيير أو 
إزالة أية فونيهات أو إضافتها حتى تكون الكتابة الصوتية مطابقة تماما للصوت. 


ويوضح الشكل )١17-7(‏ صورة توضيحية لبرنامج [10/1. 


-هو/- 


هذه الطبعة إهداء من المركز 
ولا يسمح بنشرها ورقيا أو تداولها تجاريا 
ار 6 لط ييا 


وين 00 
07 14 25 14 753 20 اعموحاعه ‏ احازاوه؟ ورين 9 
5-5 98 ع وم -------- وزمرو بم : 
| للد جاعوء 5 مامك أبن 899 : 

و0 7 1 سسا إلى 1 الاك 


حي 
اسيم 

مضكة اس بصق دسدظ شل صصح سحاو مذوية 4 شبد . 

اب سر به ل«مسموم +0 لجعو جاه عرمر عذ بمو د د 

صما 1 0 ود جد جيه 34 هر عيبر نس د جك 

٠: م‎ 

١) لا‎ 

| لم 


ا | و#اسسسرسوووري سوير ومسو هسورع مسصره 
لببللسسامما ا 3325221هك سكم 010 


الشّكل ؟ -"17: صورة توضيحية لبرنامج [5011. 
أ 0 لطاع . 17717777 


00 نامج 87119 -اك]1 1001 51001 جمعلسد31 مع11100) 

الا حيس اكوك ا ب لح ا 
الي ل و ل 0 
كما أن ملفات 120 تنتج عن هذه الخطوة» التي تحتاج إليها في إجراء التعديلات على 
مواضع بدايات الفونيهات» كما تعد تلك الملفات جزءًا رئيسيًا في قاعدة البيانات التى 
يتم تخليق الصوت منها [75]. 


تارب 


ببليوجرافيا مرجعيّة 


.١ 


ابن جنيء أبو الفتح عثمان :)١9/25(‏ سر صناعة الإعراب» تحقيق حسن هنداوي» 
دار القلم» دمشق. ط .١‏ 

ابن سيناء علي الحسين: الرّئيس: تحقيق محمد حسان الطيان ويحيى مير علم؛ 
مطبوعات مجمع اللّغة العربيّة بدمشق. 

أحمد. أحمد أحمد راغب أحمد :23٠١5(‏ فونولوجيا القرآن - «دراسة لأحكام 
التجويد في ضوء علم الأصوات الحديثء (رسالة ماجستير)» كلية الآداب» 
أحمد. أحمد أحمد راغب أحمد(7١١223):‏ دور المؤثرات الصوتية في تقدير المدى 
الزمني للفونيم» مجلة الدراسات اللغوية والأدبية» العدد . المجلد . 

أحمد, أحمد أحمد راغب أحمد(5 :)3١ ١‏ تأصيل النظرية الصوتية عند إخوان الصفاء 
محلة الدراسات اللغوية والأدبية» العدد 5» المجلد الثاني. 

أحمد. أحمد أحمد راغب أحمد :)75١١5(‏ قضايا صوتية خلافية في ضوء التحليل 
الصوى الحاسوبي. مجلة جامعة القدس المفتوحة, العدد ”7, المجلد الأول.. 
أحمد. أحمد أحمد راغب أحمد :)30١17(‏ الدرس الصوتي العربي بين النظرية 
والتطبيق» دار تمان إيهان» ط١.‏ 

أحمد. أحمد أحمد راغب أحمد (223017: النون والميم في القرآن الكريم دراسة 
صوتية حاسوبية» دار تمان إيهان» ط7. 


الأصفهانيء الرّاغبٍ: مُفْرّدات القرآن» تحقيق مُمَّد سيّد كيلاني؛ دار المعرفة. 


. أنيس» إبراهيم :)١91/5(‏ الأصوات اللغوية» مكتبة الأنجلو, ط 0. 
. أيوب» عبد الرحمن :)١985(‏ الكلام إنتاجه وتحليله» مطبوعات جامعة الكويت. 


. بولجرام» أرنست (/197م): في علم الأصوات الفيزيقي» ترجمة د. سعد 


-/ا/م - 
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هذه الطبعة إهداء من المركز 
ولا يسمح بنشرها ورقيا أو تداولها تجاريا 
:ا ييا 


الحمدء غانم قدوري (21145): أبحاث في علم التجويدء دار عمار للنشر 


والتوزيع. الأردن. 
الحمد »)١1987(‏ غانم قدوري: الدراسات الصوتية عند علماء التجويد. مطبعة 
الخلود ببغداد. 


الخولي» محمد على :)١9/1/(‏ الأصوات اللغوية» مكتبة الخريجي. ط .١‏ 
شاهين, عبد الصبور (/14171): المنهج الصوتي للبنية العربية» القاهرة. 
الصَّغيرء محمّد حسين علي (11415): الصوت اللغوي في القرآن الكريم» دار 


ضوة» إبراهيم (0ء5): محاضرات ف اللغة العربية والحاسب» دار الثقافة 
العربية» ط١.‏ 

العان» سللان حسن :)١11/72(‏ فونولوجيا العربية» ترجمة ياسر الملاح» مطبوعات 
النادي الأدبي الثقافي بجدة» ط١‏ . 


. عمرء أحمد مختار :23٠٠5(‏ دراسة الصوت اللغوي. عالم الكتب. 


1 الغامدي. منصور بن محمد :)3٠١١(‏ الصوتيات العربية» مكتبة التوبة» ط .١‏ 


فتيح» محمد :)١45(‏ الأصوات العامة والأصوات العربية» دار الثقافة العربية» 
القاهرة. 

قدور, أحمد محمد :)١114/(‏ أصالة علم الأصوات عند الخليل من خلال مقدمة 
كتاب العينء دار الفكر المعاصرء بيروت» ط١.‏ 

مصلوح» سعد :)١110(‏ دراسة السمع والكلام, القاهرة. 

الموسويء مناف :)١194/(‏ علم الأصوات اللغوية» عالم الكتب» بيروت» ط١.‏ 
هلال. عبد الغفار حامد :)١984(‏ أصوات اللغة العربية» مكتبة الأنجلو 
المصرية» ط؟. 
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هذه الطبعة إهداء من المركز 
ولا يسمح بنشرها ورقيا أو تداولها تجاريا 


- 06. 


الفصل الثَّالثَ 
التحليل الصَّرِك الآليّ للمُفرّدات العربيّة 


6 كه 


-١‏ الكلمة كوحدة أساسية في معالجة النص العربي. 
؟- أصناف الكلمات في النص العربي. 

- طبيعة البناء الصرفي للمفردات العربية. 

5- الصيغة البنائية العامة للكلمة العربية. 

ه- حجم حصيلة المفردات العربية. 

5- تعريف التحليل الصرفي الآلي وتطبيقاته. 

-١‏ التركيب الصرفي معبرًا الحوسبة التحليل الصرفي. 
8- الالتباس الصرفي وأساليب إزالته. 

9- بناء الموارد اللغوية اللازمة لفك الالتباس الصرفي. 


-- أدوات وبرمجيات ومعايير. 
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هذه الطبعة إهداء من المركز 1 
ولا يسمح بنشرها ورقيا أو تداولها تجاريا 


-41- 


١‏ - الكلمة كوحدة أساسية فى معالجة النص العربى 
تحفل لغتنا الجميلة بالعديد من الاستخدامات المجازية لمفردة «كَلِمة) التى من أمثلة 
دلالاتها مايل: 
١ح‏ مقالة؛ مثل قوله تعالى حَتَّى ذا جَاءَ أَحَدَهُم | 
لَعَلْ أَعْمَلُ صَاًَِا فيا تَرَكْت كَلَا له 200 
٠٠6٠‏ ]. 
عفر ارهق إفناف اذ تذرهى لومم قر معان < .ولول كلم سيقت من 
ربك لَمَضِيَ بينهم ... © [يونس .]١9‏ 
-“”,١‏ آية ومعجزة؛ مثل قوله تعالى #... إنما المسبيح عيسى ابن مَرْيَمَ رسول الله 
وكلمتة ألقاها إلى مَرْيَمَ وروحٌ مِنْهُ ... © [النساء .]1١/١‏ 
... إلى آخر ما هنالك من معانٍ ودلالات عديدة. 
ولكننا هنا في إطار العلوم اللسانية ومعالجة اللغة نختار”" التعريف التقني الآتٍ 
المحدد لتلك المفردة (الكلمة هى أصغر وحدة كلامية طليقة يمكن عند كتابتها أو 
لمتكي انال اناري ارو العا عترى ا ولا ار 6 
اللغويين العرب مثل «ابن هشام» هذا المفهوم بقوهم (الكلمة قو ؛ مفرّد) وهذا بالطبع 
عندما نضع في اعتبارنا أن «القول» لديهم اصطلاحًا يُشْترّط فيه أن يحمل معنى أو دلالة 
يتلقاها السامع أو القارئ. 
وبالنسبة للمشتغلين بمعالحة اللغة حاسوييًا على المستوى الصرفي أو النحوي أو 
الدلالي أو ما بعد ذلك من مستويات وتطبيقات لتلك المعالجات. فإن الكلمة لديهم 
كذلك هي وحدة أساسية للتعامل مع النص. ولأن كل تلك المعالجات على المستوى 
الحاسوبي مثقلة بمشكلة الالتباس (أي احتمال أكثر من تأويل) فإن الحاسوبيين لا يُدَلحم 
من نقطة بداية غير ملتبسة يستطيعون الانطلاق منها في عملهم» ويمكننا أن نطلق على 
نقطة البداية هذه اسم «الكلمة الرقمية الخام» (010 0181121 علنته) ولكى نتفهم 


الجدل كتابًا منفصلاًء ولذا فقد أوردنا فقط أحد التعريفات العملية المقبولة على نطاق واسع. 
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هذه الطبعة إهداء من المركز 
ولا يسمح بنشرها ورقيا أو تداولها تجاريا 
:ا ييا 


ماهية ذلك نحتاج أولاً لإلقاء نظرة على الهيئة الرقمية التي يبدو عليها النص الخام المراد 
تحليله لخويًا. 

يبدو ١سَيّال‏ النص» (615]56857]) الرقمي الخام عند تداوله على الحاسبات الرقمية 
عبارة عن سلسلة من الشفرات «الأكواد» (00068) يدل كل منها على رمز معيِّنِ واحد 
إلى آخر ما هنالك من رموز. ويستخلص ال حاسوبيون الكلمات العربية الرقمية الخام من 
سيال النص الرقمي الخام بالتعريف الإجرائي غير الملتبس التالي: 

الكلمة العربية الرقمية الخام هي تسلسل من الشفرات يَرْمُرْ كل منها إما إلى حرف 
التسلسل من كلا طرفيه شفرة لا ترمز إلى حرف هجائي عربي ولا إلى علامة ضبط 
صوق عربي. 

ميل هذه الفقرة القصيرة (الواردة في هذا الشكل رقم ١‏ في الفصل رقم )١‏ للتعريف 
الإجرائي لما اصطلحنا على تسميته «الكلمة الرقمية العربية الخام»» حيث مُيّرَت كل 


1 |] 0 


الشّكل 1-7 : استخلاص الكلمات العربية الرقمية الخام من النص العربي الرقمي الخام. 

والشكل رقم )١1-7(‏ أعلاه يعرض مثالاً على استخلاص الكلمات العربية الرقمية 
الخام من النص العربي الرقمي الخام. 

تصير هذه الكلمات العربية الرقمية الخام بعد استخلاصها جاهزة لمختلّف أنواع 
المعالجة الحاسوبية» والتى غالبًا ما يكون أوها التحليل الصرفي الآلي وهو بدوره يكشف 
ما إذا كانت هذه الكليات الرقمية الخام لا تؤدي إلى كلماتٍ غير عربية؛ سواء أكانت 
كلمات أجنبية مكتوبة باالحروف العربية (150508 7130511628160 ) أم كانت مجرد كلمات 
خاطئة غير ذات معنى» أو كانت تؤدي إلى كلمات عربية سليمة بأصنافها المختلفة وهو 
ما يَسْلمنا إلى القسم التالي الذي يعرض لتصنيف الكلمات العربية. 


غ4 


؟- أصناف الكلمات في النص العربي 

عند عرض الكلمة العربية الرقمية الخام على اَل صرقّ آلي) مُعْتبَ فإنه من 
المفترض أن يستطيع هذا المحلل التعرف على تصنيف الكلمة (أو الكلمات) العربية 
الحقيقية التي تناظرها هذه الكلمة الرقمية الخام. 

فمن الوارد ألا يتوصل المحلل الصرفي إلى أية كلمة عربية حقيقية تناظر الكلمة العربية 
الرقمية الخام التي قد تحتمل عندئذٍ أحد أمرين؛ إما أنها كلمة غير عربية (أجنبية) مكتوبة 
بحروف عربية (1:325111678]60) كالأمثلة التي تَرِدْ في الحالة ” و١‏ بالشكل رقم 59 - 
؟) في ختام هذا الْقِسْمء ؛ أو أنها كلمة خاطئة كالأمثلة التي تَرِدْ في الحالة ” نفس 
الشكل. وربما يكون الخطأ في الحالة رقم ” اهمأ كلا بحيف فكرن الكلية الرقية 
الخام عبارة عن سلسلة حروف عشوائية لا معنى لهاء أو أن منشأ الخطأ خلط من الكاتب 
(أو من الناسخ) بين حروف الهجاء أو إسقاط بعضها أو التصاق كلمتين ... إلخ. 


١‏ - تمييز الكلمات الأجنبية المكتوبة بحروف عربية 
وقبل استكمال استعراض ال حالات الأخرى التي يجملها الشكل رقم (7 -7)) فإن 
موضوع التمييز بين كلتا الحالتين السالف ذكرهما يستحق وقفة متأنية لأنه ليس بالأمر 
التافه وإن بدا كذلك لأول وهلة. فالبعض بالفعل يقارب هذه المسألة عبر إنشاء قوائم 
مطوّلة بالكلمات الأجنبية التي نُكْتَب بحروف عربية» وعلى الرغم من البساطة الظاهرية 
لهذه المقاربة إلا أنها ملغمة بالمشكلات الخنمس الآتية: 
يتغير تواتر الكلمات الأجنبية التي تكتب بحروف عربية - وهي في الغالب 
الأعم أساء +ابامخمرازمع'الزمن».فإذا تأملنا ما يزامن هذه الأسراء في العليوم 
المعاصرة المختلفة أو في الأخبار - على وجه الخصوص - فإننا نجد باستمرار 
كلمات تَهِدّ وأخرى تختفي وبمعدل عالٍ يزيد من تسارعه حاليًّا الانفتاح المائل 
في الاتصالات والعولمة» وهذا كله يجعل من تحديث مثل تلك الجداول - ناهيك 
عن إنشائها في الأصل - أمرًا عالي التكلفة. 
* منشأ هذه الكلمات الأجنبية التي قد نصادفها مكتوبة بالحروف العربية ضمن 
نصٌّ عرب قد يكون- حسب تعريفها - هو أية لغة من لغات البشر خلاف 
العربية بالطبع؛ وعلى سبيل المثال: 
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هذه الطبعة إهداء من المركز 
ولا يسمح بنشرها ورقيا أو تداولها تجاريا 
ا:6ة6ا ب ييا 


«شِنْعِهَاي), ابيُونْح يَانْخ) «إِذْوَارْدُو)ء» «جِوَادًا لَاخَارَا)» «طشْقَنْذ 
2هشظ2 «بُورُونْدِي). لمِيُونِخ)» «بُودابشت»» اك انرون 
(مِسيسَاجَا)ا افك وكني1: «كَوَالَامبُورٌ) 5-5 إلخ. 
وهو ما يجعل أية محاولة لوضع ناذج -ولو تقريبية- تترصد أو تتحسب لمثل 
هذه الكلرات ضوتيًا أو صرفيًا -أو ماسوق ذلك- أمرًا متعذرًا. 
يزيد من صعوبة الحصر أن الحجاء الذي تكتب به كل كلمة من هذا النوع يفتقد 
بالطبع إلى مرجعية عربية وبالتالي إلى أية مرجعية» وعلى ذلك فهو أمر اجتهادي 
قد يتغير من مترجم لآخر ومن كاتب لآخر؛ ومن أمثلة ذلك اللهجاءات المتداولة 
للكلمات الآتية: 
دسقداع ستحمة8: (بير مِينْجِهَامْ 5 «ابرْمِنْجِهَامْ 5 ١برْمِينْجِهَامْ‏ ( 
مكلصااظ 5150: ١سِيِجْرِيدٌ‏ هُونْكّة). «سِيغرِيد هُونْكًاا. ١سجْرِيذٌ‏ هُونْكِدا. 
ازِيغْرِيدٌ هُولْكَة)» .... إلخ 

ص واكك 4 هل 5 ل ين 
130 «دايتون)». «داتون». «ديتون» 
(واع أ تاعصظ لمماعصظ): (إِنْجِلْيترَااء إنْكِلترَاا إنْغِلْترَة) 0 إلخ 
كما يرتفع التحدي أكثر وأكثر أمام خيار حصر هذه الكلمات في جداول بسبب 
دخول اللواصق العربية على الكلمات الأجنبية المكتوبة بالحروف العربية» بل 
ويمكن لهذا الدخول أن يغير من هجاء هذه الكلمات؛ ومن أمثلة ذلك: 
(أكَادِيمْيَا): «أَكَادِيوِيٌّ1. «الْكَادِيويو نَ) «لِلْدَكَادِيية) ...الخ 
(فَرَنْسَا): (الْمَرَنْسِيُونَ» «الْمَرَنْسَاويَ) إلخ 
(أَرْمِيئيا): الْأَرْمَنْف «أَرْمَيْ) إلخ 
ويزيد الطين بل أن كثيرًا من الكلمات الأجنبية التي تكتب بحروف عربية قد 
تشترك هجائيا مع كلمات عربية؛ مثل الأسماء الأجنبية (١مِيرْ)ء‏ (ميت)» (تِيم)» 
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«دُونَ)» ...) ومشتركاتها اللهجائية العربية («مير)ء ١ميت)»‏ (تيمء لدون) ... 

إلخ). 
وسيب هذه الشكلات عنمعة :ان الآنظية الأكتر تضيجا لمعاطة اللقة العرية 
حاسوبيًا تع مقاربات أخرى أكثر احترافًا في هذا الصدد يمكن تصنيفها تحت القسمين 
التاليين: 

القسم الأول يؤجُّل التعامل مع هذه المسألة بعد التحليل الصرفي إلى حين إجراء 
تحليلات لغوية من طبقات أعلى وذلك مثل «تعيين أقسام الكلام» ((-014-ئروم 
اعم داءووم؟5 و/ أو الدّلالة و/أو النحوء حيث تغتير حيئثل المسألة جزءًا من 
مسألة تمييز (أسماء الأعلام» (7131265 ننءم2:0) عن سواها من كلمات النص والتي 
توظف اللا عادةً أساليب تعتمد على بعض القرائن المرجّحة من مخرجات تلك الطبقات 
اللغوية اللاحقة إلى جانب النماذج الإحصائية الرياضية. 


القسم الثاني تحرج هذه المسألة من إطار طبقة التحليل الصرفي» ويصدّرها ببساطة 
إلى مستوى التطبيق القائم على هذه المعالجة اللغوية. والمنطق وراء ذلك هو أن الاحتمال 
كبير أن يكون الحل ضمن التطبيق أكثر يَسْرّا وأقل التباسًا وذلك با يتوافر عندئذٍ من 
معلومات إضافية - أو حتى قيود إضافية - كما أن التطبيق رب| يتطلب مجرد تمييز جزئي 
فقط أو حتى لا يتطلب من الأصل تمييز الكلمات الأجنبية المكتوبة بحروف عربية. 
وعلى سبيل المثال؛ فإن تطبيقات الربط المعجمي مثلاً قد لا مهتم كثيرًا بهذا التمييز» في 
حين أن تطبيقات البحث النصي أو استرجاع المعلومات قد يكون الوعاء النصي الذي 
تبحث فيه مقيِّدَا لاحتالات تأويل الكلمات سواء العربية آم الأجنبية والتمييز بينها 
فضلاً عن أن هذا النوع من التطبيقات عمومًا غير مرهف الحساسية للأخطاء في هذا 
الصدد, أما تطبيقات التشكيل الصوت الآلي فهّمّها الرئيسى هو دقة استنباط الضبط 
الصوتي لكل الكلمات المكتوبة بالنص العربي سواء أكانت عربية أم أجنبية ولذلك فقد 
يكون من الأفضل أن تحتفظ بكل التأويلات الممكنة وفي نباية المطاف تفاضل بينها 
احتماليًا وفق ناذج إحصائية وربما مع قيود فونولوجية تضمن موافقة الضبط الصوتي 
المرجّح للقوانين الصوتية العربية 7 


-١‏ القسم السادس من هذا الفصل مخصص لتطبيقات التحليل الصرفي الآلي للنص العربي. 
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هذه الطبعة إهداء من المركز 
ولا يسمح بنشرها ورقيا أو تداولها تجاريا 
:ا ييا 


7 ,"- تصنيف الكلمات العربية 

وبالعودة الآن إلى استعراض بقية الحالات التي يمكن أن ينتجها محلل صر في معتبرّ 
عند تشغيله على كلمة عربية رقمية خام» فإنه يمكن أن يعثر على تركيب صرفي (أو 
تراكيب صرفية) تناظر كلمة (أو كلمات) عربية تقابل هذه الكلمة الخام وهو المسار 
الرئيسي الأول حسب الشكل رقم (75-7) أدناه. 

يقودنا هذا المسار بدوره إلى أحد مسارين؛ إما إلى كلمة عربية مصرّفة أو كلمة عربية غير 
مصرّفة» ونبدأ بمسار الكلمة العربية المصرفة وهي ا حالة رقم ١‏ و ١‏ في الشكل رقم (7-1). 

فاللغة العرببة تؤول الغالبية الكاسحة من كلاها إلى:مواد لغوية أولبة يُطلق عليها 
«جذور» وكل جذر منها هو عبارة عن؛ إما ثلاثة حروف - وهو الأكثر - ويسمى عندئلٍ 
اجذرًا ثلائيا؛ مثل مادة (ن» صء ر)» أو أربعة حروف - وهو الأقل - ويسمى عندئذٍ 
١"جذرًا‏ رباعيا» مثل مادة (ع؛ رء ق» ل). وتتولد الكلمة من صب إحدى هذه المواد في 
أحد القوالب (الصّبّغْ) الصرفية القياسية» والصيغة الصرفية هي كلمة بضبط صوتي كامل 
إلا أن عا ثلاثة حروف (إذا كانت صبغةٌ للجذور الثلاثية) أو أربعة حروف (إذا كانت 
صيغةً للجذور الرباعية) متغيرة قابلة لاستبداها بحروف الجذر عند صبه في هذه الصيغة. 

فصيغة «قَاعِل) على سبيل المثال هي صيغة تقبل الجذور الثلاثية وتكون حروف 
الفاء والعين واللام في الصيغة حروقًا عامة تقبل استبداها بحروف الجذر الثلاثي 
على الترتيب؛ فإذا صببنا على سبيل المثال جذر «ن ص ر » في هذه الصيغة 
(ف-نيع -ص» لحر) تتولد كلمة «نَاصر)» وبنفس الأسلوب إذا صبينا مادة (ع رق 
ل» في صيغة للجذور الرباعية مثل «فعاليل» - حيث يحل احرف الرابع من الجذر محل 
اللام الثانية من الصيغة الصرفية - تتولد كلمة «عَرَاقِيل» وكذلك إذا صَبَّت نفس المادة 
في الصيغة الفعلية «فَعْلَلَ) تتولد كلمة «عَرْقَلٌَ)... وهكذا تسير عملية اشتقاق الغالبية 
العظمى من الكلمات العربية التي هي كلمات عربية منتظمة التصريف. 

إلى جانب ذلك يوجد عدد محدود جدًا(بضع مئات قليلة) من الكلمات العربية غير 
منتظمة التصريف تَوَلَدَ كل منها نتيجة صب أحد الجذور في قالب صرفي غير قياسي 
(أي أنه قالب غير صالح لتوليد كلمات أخرى غير هذه الكلمة بالتحديد) أو ربا كان 
تصريفها قياسيًا في البداية ثم وقع شذوذ عنه ثم شاع الشذوذ - لسهولة نطقه مثلاً - بينم 
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حَفْتَ القياس. ومن أمثلة ذلك الكلمة الفعلية «اتَكَلّا من مادة (أ» خ» ذ) وكان المفترض 
أن يؤدي تصريفها القياسي إلى كلمة «انْتَحَدَ على صيغة (افْتَعَلَ) القياسية وذلك مثل 
نظيراتها «انْتَمَنَ) من (أ» م» ن) وكذلك « انتم تَمَّرًامن(أ. م ءر)...إلخ. 

وعطسل ذلك أن مسار الكلمة العربية المصرفة '' يتفرع بدوره إلى أحد مسارين؛ 
إما إلى مسار الكلمة العربية منتظمة التصريف (المرقم ١ , ١‏ ني الشكل رقم 5-7) 
أو إلى مسار الكلمة العربية غير منتظمة التصريف (والمرقم ".١ , ١‏ في نفس الشكل). 

أما مسار الكلمات العربية غير المصرفة - ورقمّه ١‏ ,؟ في الشكل رقم (7-5) - فهو 
دخلت اللغة ىا هي على حاا © من حيث ثبات الحجاء والضبط الصوتي (ربا باستثناء 
عبر الحركة الصوتية الإعرابية مع تغير المحل الإعرابي لما هو مُعْرّبٍ من هذه الكلمات). 
ويقودنا هذا المسار بدوره إلى أحد مسارين ن؛ إما إلى كلمة جامدة وهي الحالة رقم ١‏ و7١‏ 
في الشكل رقم (1-17) أدناه» أو إلى كلمة معرّبة وهي ا حالة رقم ١ , 7 , ١‏ في نفس الشكل. 

أمّا الكلمات الجامدة فهي بضع مئات قليلة من الكلمات العربية لكنها عالية التكرار 
قي النص العربي» وأغلبها أدوات كحروف جر وحروف ناسخة» وأساء إشارة» 
وأسماء موصولة» وحروف نداع» وضرائر منفصلة ... إلخ؟ وذلك مثل (من)» «إنك 
«دا «الَتِي)» (ياا ١نَحْن).‏ ... إلخ. 

وأمّا الكلمات المعرّبة فهي أيضًا بضع مئات قليلة من الكلمات التي دخلت اللغة 
العربية من لغات الحضارات المجاورة (كالفارسية والحبشية والسريانية 
والرومانية....) واستقرت فيها وربا عَذَّل العرب من أصواتها لتلائم ذائقتهم 
اللغوية» ومما يدل على استقرار هذه الألفاظ في اللغة العربية أن القرآن الكريم وقد 
نزل بلسان عرب مبين قد أورد بعضًا منها. ومن أمثلة تلك الكلمات المعرّبة؛ (إِسْتَبْرّق) 
0 من (إِسْتَبْره) الفارسية)» «آمِينْ» (وأصلها حبشي): لشي ا ف 

...الخ (وهي ي أسماء ء عبرانية)» ... إلخ. 

-١‏ يحتوي القسمان الثالث والرابع من هذا الفصل على المزيد حول طبيعة البناء الصرفي للمفردات العربية. 
١‏ - مثل كل أنواع الكلمات العربية» فإن هذه الكلمات غير المصرفة تقبل إضافة اللواصق إليها (من سوابق ولواحق) تحت 


شروط معينة» ويحتوي القسمان الثالث والرابع من هذا الفصل على المزيد حول هذا الأمر. 
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هذه الطبعة إهداء من المركز 
ولا يسمح بنشرها ورقيا أو تداولها تجاريا 
:اب الس ييا 


ومن الحام في هذا المقام الإشارة إلى أن اللغة العربية تعتمد أسلوبًا آحَرٌ هاما للتعريب 
أكثر مرونة من هذه الفئة المحدودة من الكلمات المعَرَّبة» ويعتتمد هذا الأسلوب على 
اختيار الحروف الأربعة الأكثر تمييرًا لِلْفْظٍ الأجنبي وجعلها مادةً لجذر رباعي يمكن 
تصريفه ى] سبق شرخه عالِيّة في الحالة رقم ١,١1١‏ فعلى سبيل المثال؛ الجذر الرباعي 
(ضكه لواف ) سعخلص من الكلمة الفرئسية اتلفرزيون» وتشكق من تلن ف كلقا 
«تِلْمَاز», «مَتَلْمَر) ...الخ كما أن الجذر الرباعي (ه ن»د» س) مستخلّصٌ من الكلمة 
الفارسية (إنْدَارّة) وَيَشْبّق منه «هَنْدَسَ )2 (مَنْدَسَقَل (مُهَنْس)... إلخ.”) 


كلمة عربية رقمية خام 
-١‏ عربية سليمة 
١١‏ مصرّفة 
١١‏ منتظمة 
أمئلة: أ سك نور ... 
50١١‏ غير منتظمة (استثناء صرفٌّ) 


أمثلة: لله تَّقَوَى. ثكم 558 


-١ ١‏ غير مصرّفة 
١١‏ جامدة 


أمثلة: هو الْنِي من 0 مَعْهُم 0 
5١‏ معرّبة 
عير هرلة 


؟ -١‏ أجنبية مكتوبة بحروف عربية 


-١ 1‏ خاطئة 


> 
1 


الشّكل 1-7: تصنيف ما يمكن أن تؤول إليه أية كلمة عربية رقمية خام بعد تحليلها صرفيًا. 
-١‏ من الأمثلة الأكثر حداثة أيضًا؛ الجذر الرباعي (أ. ت» م ت) لتعريب كلمة 231103861050 الدالة على التشغيل الآلي 


أو التلقائي لمهمةٍ ماء وكذلك الجذر الرباعي (ق» و» ق» ل) من اسم شركة «16ع6008©» ليدل على البحث في »الشبكة 
العنكبوتية 101104 . 


وه وأ- 


'- طبيعة البناء الصرني للمفردات العربية 

يحتوي جسم الكلمة العربية دائً) على جزء أساسي يُطْلَّقَ عليه اصطلاحًا اسم 
«الجذّع» (5602) وهو الجزء الذي جرى للتو عرض أصنافه وكيفية نشوء كل منها 
في القسم السابق. لكن الجذع لا يكوّن بمفرده الكلمة العربية في حالتها العامة» بل 
إنه يمكن أن يلتصق بجزء آحر يتقدم عليه ويُطْلّقَ عليه اصطلاحًا اسم «السابقة» 
((«قءم كا يمكن أن يلتصق بالجذع جزء ثالث يَتْبِعْهُ ويطلق عليه اصطلاحًا اسم 
«اللاحقة» (*66نا5). ويَصْطلّح على تسمية السوابق واللواحق معًا باللرامين» 
(813:65). وبطبيعة الحال فإن اللواصق تضاف إلى الجذع لإنتاج كلمة توائم بنيتها 
الوظيفية سياقها النحويّ وكي تكتمل دلالتها في السياق المعنوي للكلام. 

فعلى سبيل المثال إذا كان لدينا جذع الكلمة «رمَان) - من مادة «ر ه ن» المصبوبة 
في الصيغة 0 «فِعَال) - فإن إضافة السابقة «ال» إليها ينتج كلمة «الرّمَانَا. فإذا 
أضفنا إليها اللاحقة «ات» صارت «الرمَانَات). وفي حين أن السابقة في هذا 
المثال قد أضافت سمّة التعريف فإن اللاحقة قد أضافت سمّتي ني الجمع والتأنيث» 
فإذا كانت هذه الكلمة قد وردت - على سبيل المثال - في عبارة (... مع أن هذه 
الرّمَانَاتِ الكبيرةَ كانت محل تساؤل منذ البداية ...) فإن إفادة السابقة في هذا السياق هو 
التعريف بغرض التخصيص؛ با يعني هذه الرهانات بالتحديد وليس أية رهانات 
أخرىء كما أن اللاحقة أفادت ا جمع ولأن 0 تدل على غير عاقل فإنها قد 
استخدمت صيغة جمع المؤنث» ونلاحظ كذلك ما تقتضيه سلامة التركيب النحوي 
من موافقة الصفة «الكبيرة» لموصوفها "الرهانات» من حيث التعريف والنوع (التأنيث 
في هذه الحالة) بين] احتفظلت الصفة بالإفراد لكون موصوفها غير عاقل وياثل 
الصفة في ذلك كَّ من اسم الإشارة «هذه» الذي يسبق الكلمة والفعل الذي 
يعود عليها «كانت)27. 

ومن أجل حوسبة البنية الصرفية للكلمة العربية» علينا أن ننتبه إلى أربع مسائل 
أساسية وهي مسألة اللواصق المركبة» ومسألة ضمان عدم التنافر بين أي زوجين من 


-١‏ لاحظ التغير في سمة العدد بالنسبة للصفة واسم الإشارة والفعل عندما يكون الموصوف عاقلاً؛ كأن تصير العبارة كما 
بلي: (... مع أن هؤلاء السيدات الكبيرات كُنَّ محل ترحيب منذ البداية ...). 


لاد 


هذه الطبعة إهداء من المركز 
ولا يسمح بنشرها ورقيا أو تداولها تجاريا 
:ا ييا 


الأجزاء الثلاثة لأية كلمة سليمة» ومسألة التأثير المتبادل في بنية الأجزاء الثلاثة عند 
التحامها في كلمة واحدة» ثم مسألة التوافق مع الفونولوجيا العربية عبر الإعلال 


-١ ,*‏ اللواصق البسيطة واللواصق المركبة 

فمن حيث المسألة الأولى» فإن السابقة قد تكون بسيطة ذات عنصر واحد؛ وذلك 
مثل («ال» التعريفء. «ب) الحر» «ي) المضارّعة؛ .. . إلخ) كما أنها قد تكون مركّبة من 
ارهد عنصر واحد؛ وذلك مثل (١(بال)»»‏ (فسَياء . دالعا وذلك كا في «بالأدوات» 

واانتتكع امون ااغل التركية: وكلالك هو أخال بالفية [لاسقة مقاداتتي لارتكواة سيط 
ذات عنصر واحد؛ وذلك مثل (0ة)» الوا»» الهم). .. . إلخ) ىا أنها قد تكون مركّبة؛ 
وذلك مثل ( متاق الوهماء 0 إلخ) وذلك كا ف «كاتبتان») و الِيُساعدوهُم) على 
الترتيب. 

وني حين أن القاربة الأصعب تسلك سبيل توصيف اللواصق البسيطة فقط حاسوييًا 
لبرمجيات التحليل الصرفي ومن نّم إلقاء عبء رد اللواصق المركّبة إلى مكوناتها البسيطة 
على عاتق المعالجة الحاسوبية لتلك البرمجيات» فإن المقاربة الأيسر والأكثر واقعية تقوم 
ببحضر كل السوابق المركبة وكل اللواحق المركبة الممكنة ف اللغة العربية - وهو أمر حكن 
حك أناعدة كل منها رصع منات غدودة - لم خري يعد ذلك التوصيت الكاسوي 
في برمجيات التحليل الصرفي لكل من تلك اللواصق من حيث الهجاء والضبط الصوتي 
والسََّّات والفْعْل البنيوي وهذان العنصران الأخيران في التوصيف هما اللذان يسلاننا 
للمسألتين التاليتين. 

*, 7- شروط التحام اللواصق بجذع الكلمة 

أما المسألة الثانية فهي أن التحام اللواصق بجذع الكلمة لا بُدّ أن يحقق شروط 
عدم التنافر بين أي جزأين من الأجزاء الثلاثة الأساسية للكلمة (السابقة 
الجذععء اللاحقة)؛ فيمكن - على سبيل المثال - أن تلتحم سابقة «ال2 التعريف مع 
جذع الكلمة الاسميٌ (صَالح) مع اللاحقة (ة) لتكوين الكلمة«الصَّالحة» 
لأن هذه الأجزاء الثلاثة لا يتنافر فيها أي زوجينء كما يمكن أيضًا على سبيل المثال 


خا وات 


أن تلتحم سابقة «ي) المضارّعة مع جذع الكلمة الفعلي ١تَنَافَس»‏ مع اللاحقة هون» 
لإسناد الفعل المضارع إلى جمع المذكر ورفعه بثبوت النون لتكوين الكلمة (يَتَنَافَسُونَاء 
وذلك لأنه في كلا المثالين لا يتنافر أي جزأين من الأجزاء الثلاثة للكلمة. بين) لا 
يمكن مثلاً أن تلتحم سابقة «ي» المضارعة مع جذع الكلمة الاسمي (مَصَابِيح)» ولا 
يمكن كذلك أن تجتمع في كلمة واحدة سابقة «سَيِ) للتسويف والمضارّعة ] والتي 
تقتضي لزوم الفعل حالة الرفع - مع لاحقة الوا» التي تشير إلى حالة نصب أو جزم 
الفعل المضارع (أو الأمر) المسند لجمع المذكر. 

وللتاكدين تق قروط غدع التنائر هذه يمكق اتباع أسلوب ريافئ سمل قشيدة 
حاسوبيًا ومؤداه أن يجري تعريف فئة محدودة من السمات الأساسية - يكون عددها في 
حدود عشرات قليلة - التي تغطي كل السمات التي يمكن أن تتخذها أي من السوابق 
| اسمية, محايدة» فعلية» ... إلخ]: وكذلك يجري تعريف فئة أخرى للسمات الأساسية 
للواحقء وبناءً على ذلك يجري إعداد جدول تبين خلاياه الحالة بين كل عنصرين من 
هاتين الفئتين من حيث التنافر (تحتوي الخلية عندئذٍ على صفر) أو التواؤم (وتحتوي 
عندئل على واحد). 

وأثنا إعداد برمجيات التحليل الصرفي يُضَمَّن التوصيفٌ الحاسوبي لكل لاصقة - 
سواء كانت سابقة أم لاحقة - شفراتٍ (أكواد) السمات التي تنطبق عليهاء وكذلك 
يضمن التوصيف الحاسوبي لكل قالب صرفي (زيابة عن الجذع) السماتٍ غير المقبولة في 
اللواصق التي تلتحم معه (وأحيانًا سمةً يتتحتم وجودها في اللاصقة التي تلتحم معه). 
وتأسيسًا على كل ما سبق يمكن أن تتحقق برمجيات التحليل الصرفي في «وقت 
التشغيل) ((1101126 من وام إحدى السوابق مع إحدى اللواحق ببساطة عن طريق 
التأكد أنه لا توجد أية سمة لِلّاصقة تتنافر مع أية سمة لِلّاحقة وذلك بمراجعة الخلايا 
المناسبة في الجدول المشار إليه عالِيّه» ويمكن بعد ذلك التأكد من أن توصيف سمات 
كل من السابقة واللاحقة لا يحتوي على أية سمة غير مرغوب فيها من قبل القالب 
الع 


-١‏ وكذلك أن توصيف سمات كل من السابقة واللاحقة يحتوي على أية سمة يتحتم وجودها في القالب الصرفي. 


--١ 00 


هذه الطبعة إهداء من المركز 
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"و 7- التأثير البنيوي المتبادل بين اللواصق والجذع 

وتتعلق المسألة الثالثة بأن السابقة والجذع عند التحامهم| يؤثران بشكل متبادل في 
حصي للحن من حبك مجاه والصيد الصو و ذا اكويهر الكا قدا التيخام ادع 
واللاحقة معّاء فعلى سبيل المثال؛ إذا التتحمت السابقة «بال» بالجذع «اقتِصّادا (الناتج 
عن صب مادة الجذر «ق ص «١‏ في القالب الصرفي «افْتعَال)) فإن ألف الوصل 1 
تتصدر الجذع تصير غير منطوقة داتًا بسبب اتصاها بالسابقة قة (وهذا هو فعل السابقة 
الجذع) ولكن ذلك يؤدي إلى تتابع ساكتيّن (اللام في السابقة ة والقاف في الجذع) وهو 
ما يخالف القوانين الصوتية (الفونولوجية) العربية وللخروج من ذلك مرك الساكن 
الوم الا وا ساورلا ل ولب ار و اليد 1/ السام 

هي ١بِالإقْتِصّادا‏ . وعلى الجانب الآخرء إذا التحم الجذع «صَمَتَ» (الناتج عن صب 
قاد الخد «ص م ت» ف القالب أصرنٍ «فَعَلَ)) مع الللاحقة ١اثم)‏ - وهي ضمير 
الرفع للمخاطبين - فإن هذه اللاحقة تقتضي تسكين آخر حروف الفعل الماضي وهي 
التاء (وهذا هو فِعل اللاحقة في الجذع) فيصير لدينا حرفان متشابهان أولم| ساكن وهو 
ما تقتضي القوانين الصوتية العربية إدغامهه| مما في حرف مشدد (وهذا هو فِعل الجذع 
في اللاحقة) فتكون نتيجة هذا الالتحام هي ١صَمتم).‏ 

وللتعاملٍ حاسوبيًا مع هذه المسألة فإنه يجري تعريف فئة محدودة العدد من التأثيرات 
التي يمثل كل منها فِعْلاً متبادلاً بين بنية السابقة والجذع؛ كما يجري كذلك تعريف فئة 
أخرى محدودة العدد من التأثيرات التي يمثل كل منها فِعْلاً متبادلاً بين بنية الجذع 
واللاحقة . ويكون كلّ من هده اتأثيرات في كلت الفتتون عبارة عن إجراء حاسوبي مكون 
من خطوات مشروطة لتعديل بن بنيتّى الجزأين الملتحمين حسب ما يصادفه الإجراء من 
حروف وحركات في السابقة والصيغة الصرفية الملتحمتين أو الصيغة الصرفية واللاحقة 
0 وجري بعيية الخال تعموين وو هذا الجراء نل الترضيات كابير لكل 
لاصقة أثناء إعداد برمجيات التحليل الصرنيء ىا يُضَمَّن التوصيفٌ الحاسوبي لكل 
صيغة صرفية «رايةً) ((128 وهي عبارة عن رمز رقمي ينتمي لفئة محدودة العدد) قد 


تدخل قيمتها ضمن شروط تنفيذ بعض خطوات التأثيراتٍ السابقٍ ذكرها. 


عم ٠ا-‏ 


- الإعلال والإبدال والحذف 

أما المسألة الرابعة والأخيرة فهي متعلقة بتكوين جذع الكلمة عبر صب مادة الجذر 
في الصيغة الصرفية (وتسمى أيضًا «القالب الصرفي» وكذلك «الميزان الصرني»)» وهو 
ما مررنا عليه سريعًا في القسم السابق ونود هنا أن نلقي الضوء على مزيد من التفاصيل 
الحامة بخصوصه. فبالنسبة لعدد الصيغ الصرفية الأساسية في اللغة العربية بها فيها 
الصيغ الاسمية والفعلية وبم| فيها صيغ الجذور الثلائية والرباعية فإن عددها جميعًا قد 
يربو قليلاً على المئة صيغة» هذا بافتراض أن كل حروف الصيغة الصرفية المتغيرة #خري 
التعويض عنها بشكل مباشر بحروف مادة الجذر وهي ا حالة التي عرضناها ومَدَلْنا لها 
في القسم السابق» ولكن الأمر في الواقع أكثر تعقيدًا من ذلك. 

ولتفهم ذلك ينبغي علينا أن نتذكر أن الصرف طبقة لغوية تالية للطبقة الصوتية 
(الفونولوجية) وهذا يعني أن البناء الصرفي العربي محكوم بالقوانين الفونولوجية العربية» 
وفي حين أن هذه القوانين لا تمنع التعويض المباشر في الحروف المتغيرة للصيغة الصرفية 
حين تكون الحروف في مواضع «صحَّة/ صحيحة)»؛ وذلك مثل صب مادة 
(ك» ثء ر) في القالب الصرفي ١تقَاعْل)‏ حيث نحصل بالتعويض 
المبإاشر(ف ده دَث» ل حر) على جذع الكلمة 'تَكَانَْاء ولكن بعض الحروف قد 
تقع في مواضع «عِلّةا أو مواضع «إبدال» صوتية وهو ما يجعل التعويض المباشر في هذه 
المواضع تخالمًا للقوانين الفونولوجية العربية فيتوجب عندئظٍ من أجل موافقتها تبديل 
الحرف عند أحد هذه المواضع بحرف آخر أو حتى حذقّه أحيان” 

ونضرب لذلك بعض الأمثلة؛ فلو عوضنا بشكل مباشر عند صب مادة (س» ق» 
ي) في صيغة «اسْتِفعَال) لحصلنا على «اسْتِسْقَاي) وهو مستهبجّن فونولوجيًا في العربية 
لتطرف الياء بعد ألف ممدودة ما يقتضى تحوما إلى همزة لتصير «اسْتِسْقَاء». ولو عوضنا 
بشكل مباشر عند صب مادة (و, ل في صيغة «مفعال» لحصلنا على «مولاد) وهو 
غير مقبول فونولوجيًا في العربية لأن الواو الساكنة تلي حركة الكسرة ولابد لها من 
أن تتحرك على نفس جنس هذه الحركة فتصير ياءً ممدوة فنحصل على «ميلاد». ولو 
عوضنا بشكل مباشر عند صب مادة (ضء رء ب) في صيغة «افتِعَال لحَصّلْنا على 
«اضْيرَاب» وهو متعذر النطق لصعوبة الانتقال من تحرج الضاد - وهو حرف مفخَّم 


1١٠6م‎ 
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- بعد السكون عليه إلى المخرج البعيد عنه للتاء - وهو حرف مرقّق - فيتوجب لذلك 
تحريك حرف التاء إلى مفخمها فتصير طاءً يمكن الانتقال إليها بِيّسْر بعد الضاد الساكنة 
فنحصل على «اضطِراب». ولو عوضنا بشكل مباشر عند صب مادة )ت. ل, و) في 
صيغة فعل الأمر «افْحْلُ) لحصلنا على «اتْلُوٌا - هذا بالطبع إذا لم تكن هناك لاحقةٌ بعد 
الفعل؛ أي إذا كان الأمر مسئّدًا إلى مفرّد مخاطب - وهو عسير النطق بسبب صعوبة 
المحافظة على تسكين الواو بعد حركة الضمة حيث أن الفونولوجيا حينئذ تدفع نحو 
تحريك الواو بالمد ولكن ذلك يطمس علامة إعراب الفعل المجزوم» ولذلك تحرف 
الواو كعلامة إعراب ونحصل على 'أَثْلُّ» كفعل أمر مجزوم وعلامة جَزّمه حذف حرف 
العلة وهو الواو في مثالنا هذا. 

وتستلزم تغطية حالات الإعلال والإبدال والحذف في كل الصيغ الصرفية العربية 
إضافة توصيف حاسوبي لصِيّْ صرفية فرعية تصف كل منها حالة من تلك الحالاات» 
وعلى ذلك يتجاوز العدد الإحمالي للصيغ الصرفية الألف بقليل» كا تُعَيّن الحروف 
اللغيرةن الشكى افضاني من التوصيت الخاسوي لكر ين هده الضيع برعو ادل عل 
ما إذا كانت صحيحة أو معتلة أو محذوفة فضلا بالطبع عن ترتيب كل منها بالمناظرة 
مع حروف الجذور. وجدير بالذكر أن التوصيف الصوتي للصيغة الصرفية هو ذاته 
التوصيف الصوتي لكل الجذوع التي يمكن أن تنتج عن صب مادة أي جذر فيهاء كا أن 
محدّدات قابلية التحام هذه الجذوع باللُواصق - كىم| سبق التنويه إليه في القسم الفرعي 
قبل السابق - يتضمنها أيضًا التوصيف الحاسوبي للصيغة الصرفية ©. 


4ت الضيغة البدائية العامة للكلمة العربية 


بناءً على كل ما عرضناه في القسمين السابقين (الثاني والثالث) من هذا الفصلء فإن 
الكلمة العربية تتولد عبر الخطوات الثلاث التالية: 

أ. تُصَبِّ أولاً مادةٌ إحدى الجذور في إحدى الصيغ الصرفية التي يسمح توصيفها 

الحاسوبي باستقباله (وفق القوانين الفونولوجية العربية) وذلك لإنتاج جذع 


١-لمزيد‏ من التفاصيل التقنية الدقيقة لكل ما ورد في هذا القسم يمكن الاطلاع على الفصل الخامس بالمرجع رقم ]١5[‏ 
فى قائمة المراجع نباية هذا الكتاب. 


ع5 وا- 


الكلمة» ونرمز لهذه العملية كما يى: 
جذع كلمة - جذر ل)-> صيغة صرفية 
بين السابقة والصيغة الصرفية للجذع, مع أخذ التأثير البنيوي المتبادل بين 
السابقة والجذع في الاعتبار. ونرمز لذلك كا يليٍ: 
سابقة 6©->جذع كلمة - سابقة 9©->(جذر 0)-> صيغة صرفية) 

اج تلتحم إحدى اللواحق مع الناتج من الخطوة السابقة إذا تحققت شروط عدم 
التنافر بين اللاحق والصيغة الصرفية» مع أخذ التأثير البنيوي المتبادل في 
الاعتبار» فنحصل بذلك على الكلمة في شكلها النهائى. ويمكننا صياغة هذه 
الخطوات رمزيًا ىا يلي: 


كلمة عربية - سابقة © “(جذر :) “ صيغة صرفية)” 6 لاحقة 


الشّكل *-#: الصيغة البنائية العامة للكلمة العربية. 


تعد هذه الصيغةٌ ركيزةً أساسية لحوسبة الصرف العربي عبر برمجيات التحليل 
الصرفي العربي» هذا بالطبع شريطة أن تستطيع بالفعل استيعاب أية كلمة تقع تحت أي 
من أصناف «الكلمات العربية السليمة» المبيّة في الشكل رقم (7-1) عالِيّه. ففي حين 
أن القسم السابق قد أوضح بالتفصيل دقة توصيف هذه الصيغة البنائية لبنية الكلمات 
العربية منتظمة التصريف. فإنها أيضًا تنطبق على الكلمات العربية استثنائية التصريف 
حيث يكون جذع كل استثناء صرفي حالةً فريدةً لا تقبل معه الصيغة الصرفية الاستثنائية 
أن يُصَبَّ فيها إلا جذر وحيد ولذلك فإن توصيفها الحجائي لا يحتوي على أية حروف 

ويتبقى الآن نوعان من الكلات العربية غير المصرفة؛ وهما الكلمات الجامدة 
(وعددها مئات قليلة) والكلمات المعرّبة (وعددها كذلك مئات قليلة)» وكلاهما بحاجة 
إلى أن يجد مكانًا وتفسيرًا في هذه الصيغة البنائية العامة للكلمة العربية. فعَلٌ 
ناحية الصيغة الصرفية فمن الواضح أنه يمكن مناظرتها بسهولة - في كلا النوعين - 


-١ ل/اه‎ 


هذه الطبعة إهداء من المركز 
ولا يسمح بنشرها ورقيا أو تداولها تجاريا 
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بحالة الاستثناء الصرني أي أن ن الجذع الجامد أو المعَرّب يلعب هو نفسه دور الصيغة 
الصرفية بلا أية حروف متغيرة» أما على ناحية الجذر فيبدو لأول وهلة أنه عديم القيمة 
لأنه لا يلعب دورًا في توليد الجذع ولا الكلمة» ولكننا نستطيع أن نعطيه دورًا قد يفيد 
في بعض التطبيقات للمعالجة الحاسوبية للغة العربية. 

فمن المفيد بالنسبة للجوامد أن ننظر إلى المترابط منها وظيفيًا كعائلة نتتخب إحداها 
(ويفضّل أن يكون أبسطها تركيباء أو أكثرها شيوعًا) كجذر لهذه العائلة» فعلى 
سبيل المثال؛ الأسماء الموصولة (١مَنْ»»‏ «ماا» «الَّذِي»» «الَّتِي»» «الّذِينَه» «اللّاتي»..) 
يمكن أن ننظر إليها كعائلة ونضع ها جذرًا وليكن 'الَذِي»» كما يمكن أن ننظر إلى ضهائر 
الرفع المنفصلة في حالة الخطاب !«أنتَى «أنتل «أنقّاك «أَنْتَو «أَنْتْن)) كعائلة 
ونضع لها جذرًا وليكن أَنْتَّ)) ... وهكذا. وفي حالة وجود جامدة غير مرتبطة بغيرها 
من الجوامد فإن الجذر ببساطة يكون مساويًا للجذع وكفى. 

أما في حالة الكلءات اللمعرّبة فتلك العائلات تضم إما الكلمة المعرّبة بمفردهاء 
أو الكلمة المعرّبة بتفرعاتها الحجائية المختلفة؛ وذلك مثل [١مُوسِيقَى).‏ «مُوسِيقَاا. 
اكوسيقارار.! ونضع ما جذرًا وليكن (مُوسيقى)»» وكذلك (لميكال»), «ميكائيل)؛ 
(ميخَائيل)) ونضع لها جذرًا وليكن ١مِيحَائيل)»‏ ... وهكذا. 

ويفيد تجميع هذه الكلمات في عائلات في بعض التطبيقات الحاسوبية الحامة لمعالجة 
اللغة العربية؛ ومنها على سبيل المثال «البحث في النصوص العربية»» و«استرجاع 
المعلومات»» وكذلك في بعض نواحي التحليل الدلالي العربي. 

وتأسيسًا على كل ما تقدَّمَ فإنه إذا توافر لدينا جذرٌ وصيغةٌ صرفيةٌ» وسابقةٌ ولاحقةٌ 
فإننا نستطيع عبر الصيغة البنائية العامة للكلمة العربية أن نقوم حاسوبيًا بتركيب الكلمة 
العربية المناظرة لتلك المكوٌنات (بافتراض علم تنافرها)» مع التنويه أننا بالطبع 
نحتاج أيضًالمعرفة نوع الكلمة العربية من أجل تقرير كيفية تركيب جذعها من 
جذرها وصيغتها الصرفية» ولذلك فإن التركيب (نوع الكلمة: السابقة. الجذر 
الصيغة الصرفية» اللاحقة) هو تمثِيلٌ كافٍ ومكافيٌ للكلمة العربية» مع ملاحظة أن 
غياب السابقة عن أية كلمة يعْتبّر بحد ذاته سابقة (سابقة فارغة 11ناط 
016) وبالمثل فإن غياب اللاحقة في أية كلمة يعتبّر لاحقة (لاحقة فارغة 


أت 


ناد ااتتط) . 


ومن الواضح في هذا التمثيل المعلوماتي أنه يكفي ذِكر «الكود» الرقمي لكل مُكَوّن 
من هذه المكوّنات الخمس والذي يُمْكِن من خلاله الوصولٌ إلى التوصيف الحاسوبي 
الكامل لهذا المكون في برمجيات التحليل الصرفي. 


ه- حجم حصيلة المفردات العربية 
ماهو حجم (حصيلة مفردات) (:70635111313) اللغة العربية؟ 


رَعُمَ أن هذا السؤال يبدو بريئًا بسيطاء إلا أن صياغته تحتاج أولاً إلى المزيد من 
التحديد. 


كما أن إجابته بعد ذلك تحتاج إلى نظر عميق وتفصيل! 

فمن حيث تحديد السؤال؛ فهناك حصيلة المفردات على «القيّاس»» وهناك حصيلة 
المفردات على «السماع», وبين الاثنتين فارق في الحجم كبير. 

فحصيلة المفردات العربية القياسية تشمل كل الكلمات العربية السليمة الممكن 
توليدها من المكوّنات الصرفية العربية الأساسية - أيْ؛ الجذور والصَّيّعْ الصرفية» 
والسوابق» واللواحق - عَبْرَ آليات وضوابط التوليد والالتحام السالف ذكرها في القسم 
السابق» أما حصيلة المفردات العربية السماعية فهى تشمل كل الكلمات العربية السليمة 
التى استتخدمها بالفعل الناطقون باللغة العربية تحدثًا وكتابةٌ على مر مختلّف العصور وني 
مختلف المجالات وفي مختلف المناطق الجغرافية وعبر مختلف أساليب التحدث (سردّاء 
وحوارًاء وخطابة...). 

أما على جانب تقدير حجم حصيلة المفردات على القياسء فإن المحاولات المعتبرة 
لبناء برمجيات الصرف العربي تُنْبئّنا أن أحجام فئات المكوّنات الأساسية (اللّبنات) لبناء 


الكلمات العربية هى في الحدود التالية: 
عدد الجذور المصرّفة 27 2 الل م 


١‏ - بعض المعاجم العربية المطوّلة [1] التي تُعْنَى بجمع كل الروايات تصل بهذا العدد إلى حوالي تسعة آلاف جذرء ولكن 
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هذه الطبعة إهداء من المركز 
ولا يسمح بنشرها ورقيا أو تداولها تجاريا 
:ا ييا 


عدد الصّيّْ الصرفية المنتظمة الأساسية - 06 
عدد جميع الصيغ الصرفية المتتظمة”) . ١0١‏ 
عدد الاستثناءات الصرفية 0 8 
عدد الجوامد 2 م.م 
عدد المعَرّبات 0 ع 
عدد السوابق (البسيطة والمركّبة) لاس 
غدة اللواحق (البسيطة والمركبة) 9 6ه 


ومن هذه الأرقام نستطيع أن نقدر مجموع عدد الجذوع العربية الممكن توليدها 
بحوالي النصف مليون جذع وهو حاصل ضرب عدد الصيغ الصرفية الأساسية”" 
في عدد الجذور المصرفة» ويلاحظ بالطبع أن عدد الاستثناءات الصرفية والجوامد 
والمعرّبات معًا في حدود الألف وهو عدد مهمّل بالنسبة لنصف مليون. 

أما بالنسبة لِلّواصق فإن عدد الأزواج المرتّبة (سابقة» لاحقة) غير المتتافرة 
التي يمكن أن تجتمع في كلمة عربية سليمة واحدة هو بالتأكيد أقل من حاصل 
ضرب عد السوابق في عدد اللواحق, وبالتالي فإن عدد هذه الأزواج  7٠٠0(‏ 
*غ ٠هوه)‏ + ع؛ حيث يمكن أن نعتبر (ع) معاملاً للتنافر» وتقدّر بعض الدراسات 
الحاسوبية وكذلك بعض استقراءات السمات الأساسية لِلُواصق أن قيمة «ع» تقع بين 
الثانية والعشرة؛ وعلى ذلك نستطيع أن نقدّر أن عدد هذه الأزواج الأزواج “700 
٠وه)‏ +24 86,٠٠٠١‏ زوجًا. 

وبا أن كافة الجذوع الممكن توليدها تكاد تنقسم بالتساوي بين اسمية وفعلية» فإن 
العدد الكلي للكلمات الناتجة من التحام الجذوع بأزواج اللواصق يمكن تقديره تقريبيًا 


تمحيص وغربلة كل الروايات - لاستبعاد المكرّر والمصّحَّف ... إلخ - تثمر عن عدد بين أربعة آلاف وخسة آلاف 
جذر مصرّف. 

-١‏ ويغطي هذا العدد الحالات الأساسية إضافةً لكافة حالات الإعلال والإبدال والحذف. 

-١‏ عدد المشتقات الممكنة من صب الجذر الواحد المصرّف في كل الصيغ الصرفية (بكل حالات الإعلال والإبدال 
والحذف) يساوي فقط عدد الصيغ الصرفية الأساسية» ولذلك استخدمنا هذا العددَ في حاصل الضرب. 
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عبر حاصل الضرب (18,0505ك 0969 ,000) +7 5966 ,4,500,600 كلمة 
غويية» أى «أريعة الاقف وبع مليوة)» كلمةه أو يمير آخر «أرئية نض يليواة» 
كلمة. ويشكل هذا العدد المهول حجم «فضاء المفردات» 66هم؟ نوق ةآناطة06/)) 
العربية الذي لا بدَ أن تنتمي إليه أية كلمة عربية سليمة. 


وعلى الجانب الآخر لتقدير حجم حصيلة المفردات على السماع» فمن الواضح أن 
هذه الحصيلة السماعية تحتل مجحرد حيز جزئي من فضاء المفردات العربية (الحصيلة 
القياسية)» ولكننا نحتاج من أجل تحديد اللعاة السماعية إلى تجميع ثم دراسة ما 
كِب وما قبل بالعربية عبر الأبعاد الأربعة الأساسية التالية: 


0 


أ 


البعد الزمني: حيث أنه كلما مر الزمنء جد استخدام كلمات من فضاء المفردات 
العربية لى تكن مسموعة من بل" ومن أمثلة هذه الكلمات اعرد الي 
انتقلت إلى الحصيلة الساعية حديثا؛ «اكتتاب»». و«حاسوب)». و«ثلاجة), 
و«الرَسْمَلَة) و «الإشْترَاكيّة). إلخ. 


البعد الجغرافي: حيث يشيع استخدام كلمات عربية سليمة في مناطق عربية 


معيّنة بيندا هي مهجورة أو نادرة الاستخدام في باقي المناطق» فعلى سبيل ال مثال 
تستخدّم في المغرب العربي دون غيره من المناطق العربية كلماتٌ عربيةٌ سليمة 
5 85 5 ع د 22 
مثل؛ «تظاهرة» (مناسبة عامّة مثل المعرض أو المهرجان)» و١مَفْتَشِيّة)‏ (هيئة أو 
سلطة التفتيش»» و«الفارط» (صفة تُسْتَخْدَم مع الأزمنة كالشهر والسنة بمعنى 
السابق أو الفائت)» و«دَرَكِيَ) (شرَطِيَ)» «حَرّاقة) (مهاجرون غير شرعيين في 


. البعدالموضوعي: حيث تُسْتَضْدَم كلمات عربية سليمة كاصطلاحات 


في مجحالات/ موضوعات بعينها بينا يقل أو ينعدم ذكرها فيما سواها 
من مجالات/ موضوعات؛ ومن أمثلة هذه الكلمات «الأييض» رفي علوم 
الأحياء والكيمياء العضوية)» و «الاتتكال» (في علوم الكيمياء 
وهندسة المعادن). و«الالتباك» (في مجال البلاغة)» و ١محَحْمَل)‏ (في العلوم 


-١‏ هذا بالطبع إضافةً إلى تلك الكلمات المسموعة بالفعل والتي تكتسب دلالات جديدة مع مرور الزمن. 
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هذه الطبعة إهداء من المركز 
ولا يسمح بنشرها ورقيا أو تداولها تجاريا 
:ا ييا 


العسكرية) ... إلخ. 


د. البعد الأسلوبي: حيث تختلف الكليات المستخدمة مع أسلوب الكلام» ففي 
الأسلوب السَّرْدِيٌ يغلب مثلاً إسناد الأفعال للغائب؛ مثل «قالّ». «قالوا»» 
(صَرَّحَا «أكَدَثْ) ... إلخ» كما يندر الإسناد للسكلم والمخاطبء ويندر 
استخدام صيغة الأمر ويندر استخدام أدوات النداء» ... إلخ» أما في الأسلوب 
الجواريٌ يكثر إسناد الأفعال للمخاطبء كم يمكن مصادفة الإسناد للمتكلم» 
ويمكن مصادفة أفعال الأمرء ... إلخ» وكذلك يتميز الأسلوب الْخَطَابي 
بمفردات خاصة. ... وهكذا. 

نحتاج إذن لجمع ما قبل وما كتب بالعربية على امتداد هذه الأبعاد الأربعة من أجل 

استخلاص حصيلة المفردات العربية السمعية حصرًا وعداء وفي حين أن حصر وعد 
المفردات هو أمر متيسر حاسوبيّا فإن مهمة الجمع غير هينة أبدّا ليس فقط لضخامة 
الحجم بل أيضًا لأن الكثير من نطاقات الأبعاد السابق ذكرها غير مغطاة رقميًا بشكل 
كافٍ؛ وذلك مثل اللغة التراثية» والأسلوب الحواري. 


يمكن طرح عمليات الجمع والحصر والعد السابق ذكرها كمشروع كبير مقترح يتعاون فيه 
للق لاي ور ار ار ا ا سان 
حيث أن ذلك العمل لم يتم بشكل مستوفٍ حتى تاريخ كتابة هذه السطور. 


وأا ما كان التقدير الدقيق لحجم الحصيلة السماعية - التي تتراوح تقديراتها «الخُرَافيّة) 
بين الواحد في الألف والواحد في المئة من حجم فضاء المفردات العربية - فإنه يمكن 
بثقة تقرير عدد من الحقائق الحامة: 
أ. إن فضاء المفردات العربية ذو حجم هائل. 
ب. إن حصيلة المفردات العربية السماعية ما زالت تمثل جزءًا ضئيلاً من فضاء 
المفردات العربية. 
ج. إن حصيلة المفردات العربية السماعية بالرغم من ذلك ذات حجم ضخم (يقدر 
بملايين الكلمات حسب أكثر التقديرات تواضعًا) يفوق حجم حصيلة المفردات 
السماعية في لغات العالم الحبة الكبرى» ولذلك فإن تلك الحصيلة تحتاج عادة إلى 
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مزيدٍ من العمل مره ابقواران لنات عار الكبرى لامر 


[ة الساحات غير المتخدفة فق فضا اللقودات العررية كبينة ذا وتشكل 
الضياظ] الفكدًا: إستراتيجا ينك «اللقة الخزية تمن الاتعجانة الذاتية المرنة 
للاحتياجات الاصطلاحية الراهنة والمستقبلية في مختلف مجالات النشاط 
الإنساني» وذلك في تواصل مطرد بسلاسة مع التاريخ العريق الممتد اللغة. 


5- تعريف التحليل الصرفي الآآلي وتطبيقاته 

تتعلق دلالات كلمة «مُورْفُولُوجى» (تإعوامطم:ه31) بمظهر وشكل الشىء/ 
الكائى ركذا قدرية غلل التشكن ودرايسة تركية مت الجا اللكونة لد وماول ذللك» 
وتُسْتخدم الكلمة بشكل اصطلاحي في عدة مجالات مختلفة؛ ففي علم الأحياء على سبيل 
المثال يعني الاصطلاح دراسة مظهر وشكل وتركيب الكائن الحَيٌّ هو وأعضائه”"2, أما 
في مجال علوم اللغة فإن الاصطلاح يعني دراسة بنية الكلمات وآلية توليدها من مكوناتها 
الأساسية وهو ما يَعْرّف في العربية بعلم الصَّرْف. 

ومن خلال ما استعرّضَنْه الأقسامٌ السابقة من هذا الفصل يتبين الانتظامٌ العالي» 
وكذللف القدرة التوليدية الهائلة لنظام الصرف العربي عبر صب الجذور في الصِيّغ 
الصرفية لإنتاج الجذوع ثم التحام هذه الجذوع مع اللواصق لتوليد آلاف الملايين 
(50,غ مليون» من الكلمات وذلك من خلال استخدام عدة آلاف قليلة فقط 
)3:60 1 من المكوّنات الصرفية» ويمكن تقديرٌ مُعامِلٍ للتوليد الصرفي بخارج قسمة 
العددين 2 587 مليون» وهو معامل هائل بكل معايير اللغات المعروفة! 

تعد هذه القدرة التوليدية الصرفية العظيمة في اللغة العربية ميزةٌ كبرى في صالح 
تعلّم اللغة العربية وكذلك ميزةً كبرى لتطبيقات معالجتها حاسوبيًا ىما سوف يلي 
توضيحه لاحقا في هذا القِسّْمء ولكن علينا قبل ذلك الانتباه إلى أن التحليل - وليس 
التوليد - هو المسألة الصرفية الطبيعية في معالجة المفردات حاسوبيًا؛ِ ذلك أن الشكل 


-١‏ بينا يُعْنىَ «الفِسْيولُوجِي» 2010510108 في علم الأحياء بالوظائف الحيوية للكائن ولأعضائه. 
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هذه الطبعة إهداء من المركز 
ولا يسمح بنشرها ورقيا أو تداولها تجاريا 
):ُ6ا6ا ب ييا 


اللغوي الذي ينتجه البشر بشكل طبيعي والمستهدّف معالجتةُ حاسوبيًا هو النص (أو 
الكلام) والذي هو عبارة عن ساسلة من الكلمات المولّدة بالفعل» والمطلوب من هذه 
لاحت يا الكليات مي البنائية الأساسية. 


اتعريف الرظيفي لأي لل صرق عري» كنظام كم في الشكل رقم (6- -5) أدناه: 


كلمة عربية +[ تحليل صرفي |-> (نوع الكلمة: السابقة» الجذرء الصيغة الصرفية» اللاحقة) 
الشّكل 5-٠‏ : التعريف الوظيفي لنظام التحليل الصرفي العربي. 
ونكرر هنا إلى أنه في العادة يكتفي المحلل الصرفي بإخراج «أكواد» كل من المكونات 
الصرفية الأساسية الخمس الفى يمكن عَنرها الوضول إل التوضيك الحاسوي لكل من 
هذه المكونات في برمجيات التحليل الصرفي العربي. ويعرض الجدول رقم (1- )١-‏ أدناه 
عينة من مخرجّات أحد برمجيات التحليل الصرفي العر بي (0: 
عند هذه النقطة وقد اتضحت البنية الصرفية للمفردات العربية وصار لدينا تعريف 


محدد للتحليل الصرفي العربي» من الطبيعي أن نتساءل عن أهمية حوسبة التحليل الصرفي 
العربي وفوائده التطبيقية. 


م ع مسا ا ا ا ا 
هما ميزتان كُبْرَيَان لِلّغة العربية تضفيان مزيدًا من الأهمية على دَوْر الصرف في كل من 
استخدامها البشري وكذلك معالحتها الحاسوبية» حيث تشكلان معًا ركيزةً لغوية 
للناطقين بالعربية ومتعلميهاء ى! تمثلان محورًا للعديد من تطبيقات المعالجة الحاسوبية 


الخ العرية. 
الكلمة نوعها السابقة الجذر الصيغة الصرفية | اللاحقة 
١ 1‏ لذ م 2 
2 جامدة 0 كح 
٠ 31 // ١ 2‏ 


-١‏ وهو الموصوف في المرجعين رقم ]١0[‏ ورقم ]١7[‏ فى قائمة المراجع نهاية هذا الكتاب. 
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الكلمة نوعها السابقة الجذر الصيغة الصرفية اللاحقة ١‏ 
له مصرّفة تّ نول تَفَاعَلَ له 
5 منتظمة 3 اع 7 1 
ار مصرّفة | لل نت فعال ات 
الكتائات ١‏ 
00 منتظمة 04 ام 4 0 
07 5 مصرّفة ال اعكم فعل 8 
العلمرة 3 
27 منتظمة 4 00 :1 1" 
ا هن من - 
جامد 
سَ 2 ٠‏ و 18 ٠‏ 
مصرّفة - وص مَفاعِيل 2 
| 
مراضح منتظمة ٠‏ كيفرة 0 ٠‏ 
ميَكَدة امبتفاء أاخذ 
- صرف . كن و ب 


الجدول :١1-7‏ أمثلة على التحليل الصرفي لبعض الكلمات العربية. 

فالملكات اللغوية للناطقين باللسان العربي تتشكل وفي أَسيسها أن السيطرة الذهنية 
على الحصيلة اللغوية ذات الحجم الضخم لا تقوم فقط على حفظ واستظهار مفرداتها 
بمعزل عن بعضها البعض بل تقوم إلى حد بعيد على الترابط البنائي والدلالي المتين 
بين هذه المفردات؛ قمر دف راتيج على سبيل المثال أن 0 مثل (١عِلّم).‏ اعَلُوم)» 
(تَعَلم)؛ اعلا امتََلّوا؛ لمعل «عالم)». .1ك - والتي تد تشارك في الجذر اع ل م 
- تدور جنيعها حول معنى مشترك عام (وهو المعرفة والفهم) وذلك على الرغم من 
أن لكل منها دلالة تفصيلية مختلفة”©, ىا أن كلمات مثل 50 «اسْتِعْطَاف)» 
«اسْتِخضّار)» «استنصار)»» «اشتكتار)» «اشتطلاع».. .1ك - والتي ت* ستاك ف القالب 


-١‏ انتبه علماء اللغة العرب منذ وقت باكر (راجع مثلاً «ابن فارس» في قاموسه «مقاييس اللغة» وهو المرجع رقم ]١[‏ فى 
قائمة المراجع نهاية هذا الكتاب) إلى أن الجذوع المشتقة من كل جذر مصرَّف تدور حول عدد قليل من المعاني الكلية 
(واحد أو اثنين أو ثلاثة» وفي حالات نادرة يزيد عدد هذه المعاني الكلية عن ذلك). وقد جرى استثار هذه الحقيقة 
الحامة في الأعمال الحديثة لحوسبة «الدلالات المعجمية العربية» وهو ما سيّفْوّد له الفصل الأول من الباب السادس 
«التحليل الدلالي» في هذا الكتاب. 

ولتكملة الإفادة من المثال المضروب على جذر «ع ل م)؛ فإن له - حسب «مقاييس ابن فارس» أيضًا - معنى كليًا آخحر 
وهو (الأَكّر يتميز عن سواه) ومن مشتقات الجذر التي تدور حول هذا المعنى الكلي [اعَلَما «أغلام»» ١مَعْلّا‏ 
(مَعًال)» 1 


-١١86ه-‎ 


هذه الطبعة إهداء من المركز 
ولا يسمح بنشرها ورقيا أو تداولها تجاريا 
:ا ييا 


الصرفي «اسْتَفْعَال» - تحمل جيعها ملمحًا ولاليًا غامًا (وهو طلب الشيء والسعي 
لتحصيله)» كما أن اللواصق تحمل دلالات ووظائف نحوية محدّدة ناه إن عل جد 
قليل د من اللّبنات الصرفية (عدة آلاف) مع إتقان ضوابط التفاعلات بين هذه 
اللبنات يمكّن المرء من السيطرة الدلالية والبنائية على الحصيلة اللغوية العربية هائلة 
الحجم (بين الملايين والبلايين)”''ما ييسر عليه القراءة والفهم وكذلك التعبير والكتابة. 
أما بالنسبة لمعالحة اللغة العربية حاسوبيًا فإن أهمية الحصول على محلل صرفي عربي 
آل تكمن ني اختصار العبء الثقيل للتعامل مع العدد ال هائل من حصيلة مفردات اللغة 
العربية عبر تفكيكها إلى عدد محدود من اللبنات الصرفية العربية الأولية. وم نيك 
الاعتماد على التحليل الصرني العربي الآلي؛ فإن بعض التطبيقات للمعالجة الحاسوبية 
للخة العربية محورُها الأسامبي هو التحليل الصرفي العربيء بينما بعض التطبيقات 
الأخرى يكون التحليل الصرفي العربي الآلي وسيلة ضرورية أو مساعدةً لإنجازها. 


ومن بين التطبيقات الحاسوبية التي تنتمي للنوع الأول؛ نذكر على سبيل المثال لا 
ال حصر: 

ُ. دعم وظائف البحث الاشتقاقي العربي في محركات البحث النصي: فالمستخدم 
عندما يبحث عن كلمةٍ ما في نطاق نص معين؛ ولتكن كلمة «اعتماد» على سبيل 
لمثال» فإنه كثيرًا ما يرغب في الحصول ضمن نتائج بحثه على مواقع كلماتٍ 
مثل «اعتمادات»» «فالاعتتاد». «واعت|ادهم»» «الاعتادية» ... وكل الكلمات 
الأخرى المشتركة في نفس الجذع والواردة في نطاق البحث (ويسمى ذلك 
«نمط البحث على مستوى الجذع»2)» وقد يود المستخدم توسيع نتائج البحث 
حتى يحصل إضافة على ما سبق على مواقع كلمات مثل «يعتمدونه»)» (معتمدا» 
«عماد»؛ «العمود» ... وكل الكلمات الأخرى المشتركة في نفس الجذر والواردة 
كذلك في نطاق البحث (ويسمى ذلك «نمط البحث على مستوى «الحذر»). 
... وهكذا. 


-١‏ كما جرى تفصيلّه في القسم السابق من هذا الفصل؛ فإن تقدير حجم الحصيلة اللغوية العربية القياسية قد يصل إلى 
أربعة ونصف بليون كلمة» بينا تتراوح التقديرات «الجزافية» لحجم الحصيلة اللغوية العربية السماعية بين بضعة ملايين 
(كحد أدنى) وعشرات الملايين (كحد أقصى) من الكلمات. 


-ا١5-‎ 


ب. الربط المعجمي العربي الآلي: فالقارئ للنص العربي إلكترونيًا ربما يحتاج إلى 
الجذور (وليست الكلمات - نظرًا لاتساع الحصيلة اللغوية العربية السابق 
ذكرُه) والتي يتطلب الوصولٌ إليها استخدامً التحليل الصرفي الآلي» ويتيح هذا 
الاستخدام أيضًا فرصة إضافة مداخل أخرى لشرح الصيغ الصرفية واللواصق 
ما يستوفي شرح المفردة من كافة زواياها. 

ج. التحليل الدّلاي المعجمي العربي: يكاد يكون من المستحيل تغطية كل المفردات 
العربية ككلماتٍ تامة - وذلك مرةً أخرى بسبب ضخامة حجم حصيلتها - 
بشكل كافٍ في قاعدة بيانات موسّعة ترتبط فيها كل مفردة با يناسبها من 
حقول دلالية (معانٍ عامّة) كا ترتبط عبر علاقات دلالية ببعضها البعض» 
ولذلك تُستبدّل الكلمات التامة بتركيباتٍ صرفية أكثرٌ مرونة منها تسمح بتغطية 
مفردات اللغة العربية بنسبة عالية في أية قاعدة بيانات للربط الدلالي» كا 
يستخدّم التحليل الصرفي الآلي للعبور من كلمات النصوص المطلوب دراستها 
دلالي إلى هذه التركيبات الصرفية(١).‏ 


د. البرمجيات التي تساعد في تعلّم اللغة العربية: وخصوصًا تلك المعنية بالحجاء/ 
الإملاء» وعِلّم الصرف. 
وكذلك العديد من التطبيقات الأخرى التى يشكّل التحليل الصرفي العربي 
اللي محورها الأساسبى. 
أما على جاتب تطبيقات المعالحة الحاسوبية للّغة العريية التى يمثل التتحليل الصرفي 
العوق الكل وسيلة فزورية أو مستاعدة لأتعازها فين أمواعياء «تشكيل اللمن 
العربي») (1(12611122600 1301ث)'" (حيث تحتوي نواتج التحليل الصرني لكل 
كلمة على «سابقة» + «صيغة صرفية» + «لاحقة» معّاء وبعد تطبيق التأثيرات البنيوية 
لالتحامها على التشكيل الصوتي للكلمة ما عدا الحركة الصوتية الإعرابية أحيانًا)", 
-١‏ للمزيد حول ذلك الموضوع يمكن الرجوع إلى الفصل الخامس «التحليل الدلالي» في هذا الكتاب. 
؟- ويْقَصَّد بذلك النظم الآلية لاستنباط علامات الضبط الصوتي لكلمات نص عرب ما. 


*- وهو بدوره يدخل في نظم معالجة لغوية أخرى؛ من بينها على سبيل المثال «تخليق الكلام المنطوق من النص العربي 


-لااك- 


هذه الطبعة إهداء من المركز 
ولا يسمح بنشرها ورقيا أو تداولها تجاريا 
:ا ييا 


وكذلك التدقيق الإملائي في النص العربي (لاكتشاف مواضع الأخطاء الإملائية و/ 
أو تصحيحها». ... إلخ. 
ويجادل البعض بعدم الحاجة إلى عملية التحليل الصرفي في التطبيقات التي يمثل 
التحليل الصرفي العربي الآلي وسيلة لإنجازهاء وبأن مثل هذه التطبيقات يكفيها 
الاقتصار على التعامل مع حصيلة المفردات العربية التامة بشكل مباشر عبر استقرائها 
من مدوَّنات نصية عربية موسّعة وبتوظيف أساليب حاسوبية إحصائية وبالتعويل على 
القدرات الكبيرة (والمتصاعدة) للأجيال الحالية من الحاسبات الرقمية» ولكن أرفع 
الأبحاث المدققة بينث حديثًا أن تغطية حصيلة المفردات العربية لا يمكن تحقيقها 
حاسوبيًا بشكل مُرْضٍ وأن أكفأ وأكمل الحلول العملية المتاحة تتكون من مزيج/ هجين 
1 كلا التوجهين20. 
من 6 


- التركيب الصرف معبرًا لحوسبة التحليل الصرفى 
كيف يجري تنفيذ التحليل الصرفي العربي حاسوبيًا؟ 
من أفضل المقارّبات الرياضية المحكّمة في علم الذكاء الاصطناعي التي يمكن 
استعارتها لإجراء التحليل الصرفي حاسوبيًا بكفاءةٍ أسلوبٌ يُعْرَف باسشم «التقييد 
المتعاقب) (5]1210108م00) 176ووعع5110).» وتقوم فكرته الأساسية على آليتين تعملان 
2 3 5 1 07 0000 
متصاعدة) من المسألة قيد البحث ومن ثم تضيفها إلى فضاء الحلول الممكنة» وثانيته| 
تختبر هذه الفرضيات مقابل القيود التي لا بد أن يلتزم بها أي حل مقبول للمسألة ومن 
نّم تحذفها من فضاء الحلول الممكنة» وتعمل هاتان الآليتان بالتعاقب إلى أن تُسْتَنْقَدَ 
لمكتوب)؛ وهذا الأخير بدوره يعتبر أساسًا تقوم عليه عدة تطبيقات مثل «تمكين المكفوفين من استخدام الكمبيوتر 
عبر قراءة محتويات شاشته)» وأنظمة «الاستجابة التفاعلية الصوتية 119/18 ... إلخ. 
-١‏ ومن أمثلة تلك الدراسات الحديثة ما جاء في الورقة البحثية الآتية: 
-013آ عاطوتخ عتأمقطء510 ث., ذث, وع21]., 5, لاملطث., /ل, 2تأأث., /3, لإمتطادة8201-الى., /ل, منهكخطمة 1[ 
-11325836' 18115, وعتتطوعء1 1[قتطعدع1' 130101120 -طنا ممه 0ع72ماعة1 01 لطن 2 زه لعمد8 تعجتاتن 
-177177177.51512121066551185501: //ماخط) طر[كك]' (عطاووءعء20 ع12151128آ 220, تاعععءم5, 0للتتخ جاه 5ه 1 


.ععع1.ع:0101تععع1: /لماط. 166-175 جزم 1: عناوو]. 19 -1701ا, 14512 /215ع1001ء 5 /قطه اندع 1 [أطدط/ع01. تجاء 
. 2.2011ة5428861-1, نا طامصتتححتة2م211.[5_دطوعع ع /أموداع :1ه 


-١١8- 


أجزاء/ مستويات المسألة فتكون فئة الحلول الممكنة للمسألة بكاملها عندئذٍ هى تلك 


التي نجت من الحذف وبقيت في فضاء الحلول. 
ولإسقاط «التقييد المتعاقب» على مسألة التحليل الصرفي العربي”"» فإن علينا اتباعَ 
الخطوات التالية: 


.ُ 


تضاف أية سابقة ينطبق هجاؤها على صَدْرِ من هجاء الكلمة محل الدراسة إلى 
فضاء الحلول. ١(آلية‏ طرح فرضيات»). 


. تضاف أية لاحقة قة ينطبق هجاؤها على عَجُزِ(!) من هجاء الكلمة محلّ الدراسة 
إلى فضاء الحلول. «آلية طرح فرضيات»). 


. من بين القائمتين اللتين حصلنا عليها في الخطوتين السابقتين يتم توليد كل 


الأزواج المرّبة الممكنة (سابقة» لاحقة) ومن نَّمَّ يتم دفعُها إلى فضاء الحلول. 
«(آلية طرح فرضيات»). 

يتم استبعادُ الأزواج المتنافرة من فضاء الحلول. «آلية تقييد)». 

لكل زوج مرنّبٍ متبقٌ في فضاء الحلول من الخطوة السابقة؛ يتم استخلاص 
0 الكلمة (الكلمة: يدؤة السابقة ا التعويض بالطبع ع 
50 ات ان الناتحجةٌ عن هذه ا إلى فضاء الحل. ((آلية طرح 
فرضيات»». 


. مُستبعد الجذوع المكرّرة من فضاء الحلول. 'آلية تقييد». 


لكل من الجذوع المتبقية في فضاء الحلول» يجري البحث في التوصيفات 
الحاسوبية لكل الجذور والصيغ الصرفية في القاعدة اللغوية لبرنامج التحليل 
الصرني عن كل الأزواج المريّبة على هيئة (نوع الكلمة: جذرء صيغة صرفية) 
التي يكون الحجاء الناتج من صب جذرها في صيغتها الصرفية مطابقًا لهجاء 
الجذعء وتدْفَعٌ فرضيات التحليل الصرفي للكلمة العربية محل الدراسة إلى فضاء 


-١‏ لمزيد من التفاصيل التقنية الدقيقة بهذا الخصوص يمكن الاطلاع على الفصل السادس من المرجع رقم ]١5[‏ فى قائمة 
المراجع نباية هذا الكتاب. 
-١1‏ عَجُز الشيء هو مؤخرته أو أسفله أو خاتمته. والجمع أَعُجاز. 


د 


هذه الطبعة إهداء من المركز 
ولا يسمح بنشرها ورقيا أو تداولها تجاريا 
:ا ييا 


الحلول في صورتها القياسية (نوع الكلمة: سابقة» جذر. صيغة صرفية» لاحقة). 
(آلية طرح فرضيات»). 
ح. وبالطبع تُستبعّد من فضاء الحلول تلك الجذوع التي لا يمكن تكوينها بصب 
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أي جذر في أية صيغة صرفية. ١(آلية‏ تقييد)). 

ط. لكل من التحليلات الصرفية الموجودة في فضاء الحلول بعد الخطوة السابقة 
يجري اختبار عدم التنافر بين السابقة والصيغة الصرفية وكذلك بين الصيغة 
الصرفية وبين اللاحقة» وتُستبعّد تبعًا لذلك التحليلات التى تحتوي على أي 
تنافر. ((آلية تقييد)). 

. يتم تركيب كلمةٍ من كل تحليل متبقٌ في فضاء الحل بعد الخطوة السابقة» ثم 
تُطايّق الكلمة الناتجة من التركيب مقابل الكلمة محل الدراسة من حيث الحجاء 
وكذلك من حيث الضبط الصوت (إن وجِدَّ أيُّ ضبط صوت في الكلمة المدحلة 
محل الدراسة)» وتُستبعد التحليلات الصرفية غير المطابقة من فضاء الحلول. 


4. 


((آلمة تقسد)). 


ىه 


ك. التحليلات المتبقية (الناجية) الآن في فضاء الحلول هي فئة كل التحليلات 
الصرفية الممكنة للكلمة العربية محل الدراسة. ((آلية تقييد)». 

وجدير بالملاحظة في كل هذه الخطوات أن الحصول على التحليلات الصرفية للكلمة 

يتم تدريجيًا عبر التركيب الصرفي (وفق ما جرى عرضه في الأقسام السابقة من هذا الفصل) 

احرضيات واد لحر لخر مقي حيار حدق ده [لدررواءك لل ررك اضرم 

العربية واستبعاد ما لا يستوفي هذه الشروطه وبتكرار هذه العملية إلى أن تُخْطَّي جسم 

الكلمة محل الدراسة يُشّكل ما يتبقى من هذه الفرضيات فئةً الحلول الممككنة لهذه الكلمة. 


/- ا افر لامر إزالته 


م صر فية ل ارح هده 
وجود تحليل صرفي عربي على الإطلاق» وهذا كله يعني على وجه العموم أن تطبيق 


00-7 


هذه العملية على أية كلمة عربية ينتج تحليلاتٍ متعددةً وهو ما يُْرَفٌ اصطلاحًا باسم 
«الالتباس الصرفي» (/إا تناع [طحطث 21ع اع 010ام1/101) . 

ويعرض الجدول رقم (7-”7) أدناه مثالا مفصّلاً على هذا الالتباس عند إجراء 
عملية التحليل الصرفي العربي حاسوبيًا على الكلمة العربية الخام «بطين)؛ حيث تم 
تظليل كل تحليل ممكن من التحليلات الصرفية القياسية المتعددة هذه الكلمة بنظل 
رمادي ذي كثافةٍ متناسبة مع درجة الشيوع السماعية لهذا التحليل 20 

وفي غياب آلية تختار واحدًا فقط من بين التحليلات الصرفية المتعددة - وهو 
ما يَعْرَف اصطلاحًا باشم «قَكَ الالتباس الصرفي» (([هعنعهامطممكة 
ع نطدنة15) - فلا يمكن أن يُعتبر هذا التحليل الصرفي العربي آليا ويظل ذا 
قيمه تطبيقية محدودة. 

ويجدر بنا قبل مناقشة كيفية فك الالتباس الصرفي العربي أن نلقي نظرةً على الأسباب 
الرئيسية لهذا الالتباس والتي يمكن تلخيصها فيا يلي: 

أ. افتقاد علامات التشكيل/ الضبط الصوتي - إلا فيهما ندر - في الكتابة المعاصرة 
للنص العربي وذلك ارتكانًا على قدرة القارئ العربي المتمرس على استنباط هذه 
العلامات بنفسه مستفيدًا من عدة قرائن سوف نذكرها فيا يلي من نقاط. 
بل إنه من الجدير بالذكر أن استنتاج علامات التشكيل الصوتي حاسوييًا لكلمات 
النص العربي الخام هو بحد ذاته هدف للتحليل الحاسوبي المعمّق للغة العربية 
يَسُْهم فيه التحليل الصرفي العربي الآلي ى| أشرنا إلى ذلك في القسم قبل السابق 
من هذا الفصل. وعلى الرغم من أن إضافة التشكيل الصوتي ولو جزئيًا لبعض 
الكلمات قد يفك/ يقلل من الالتباس فيها؛ وذلك مثل «مستعهر)ء ١مقدّم)»‏ 
ايقسّم) ... » فإن علينا الانتباه في الحالة العامة إلى عدم كفاية إضافة التشكيل 
الصوتي ولو كان كاملا لإزالة الالتباس؛ وذلك مثل (قَرَضُوا)ء «قَائْل)» (يَسِير)» 
«شَذَا» ... فقد يكون المثال الأول فعلاً ماضيًا من مادة الجذر (ف» رء ض) أو 


-١‏ المحلل الصرفي العربي المستخدّم للحصول على التحليلات الواردة في الجدول المذكور هو ذلك الموصوف في المرجع 
رقم [151] (وخصوصًا الفصول من خمسة إلى سبعة) من قائمة المراجع نهاية هذا الكتاب. 


-51١- 


هذه الطبعة إهداء من المركز 
ولا يسمح بنشرها ورقيا أو تداولها تجاريا 
:ا ييا 


فعلاً ماضيًا معطوفًا بالفاء من مادة الجذر (ر» ض» ي)» كما قد يكون المثال الثاني 
اسم فاعل من مادة الجذر (ق» و» ل) أو من مادة الجذر (ق» ي» ل)» أما المثال 
الثالث فقد يكون فعلاً مضارعًا من مادة الجذر (س» يء ر) أو صيغة مبالغة من 
مادة الجذر (ي» سء ر) أما المثال الرابع فقد يكون فعلاً ماضيًا أو اسن وكلاهما 
من مادة الجذر (شء ذ» و). 

ب. بينها تشتغل أية آلية للتحليل الصرفي على كل كلمة في النص بشكل منفرد, فإن 
الذهن البشري يستفيد في حكمه على أية كلمة من سياق النص حوها؛ فعل 
سبيل المثال نستطيع كقارئين للعربية بكفاءة فك التباس كلمة «بطين» عندما ترد 
في السياقات الثلاث المختلفة الآتية (... يحمل الدم الموجود في البطين الأيمن 
من القلب ...)» و(... الذي يختلط بطين اللأرض فيصير ...)» و(... أنه رجل 
طبن كيه 

. وفي قدراته تلك على فك الالتباس الصرفي يعتمد الذهن البشري على المعالحة 
المتزامنة لسياق الكلمة على مستويات عدة من التحليل اللغوي - وخصوصًا 
الذلالة والنسو - إضافة إل الضرف» ولموع الظ لا ترال أدواتنا الحاسويية 
والرياضية قاصرة عن محاكاة هذه المعالجة اللغوية المتزامنة بكفاءة لحظية. 
وكمثال على ذلك نحلل السياق التالي (... فالكهرباء وقود يسير هذا النوع 
من السيارات.) حيث يستبعد القارئ العربي تفسير ما تحته خط على أنه الصفة 
«يَسِير) من مادة الجذر (ي» سء ر) في صيغة المبالغة «فَعِيل» وذلك لأن ما 
يتيحه السياق النحوي من موصوفات محتملة هو «فالكهرباء» أو «وقودا 
وكلاهما بعيد دلاليّا عن وَسِْه بصفة «اليّسراء | يستبعد القارئ العربي أيضًا 
تفسيرّه على أنه الفعل اللازم ١يَسِيرا‏ من مادة جذر (س» ي» ر) وذلك لأن 
اعتبار «هذا» كفاعل صريح يؤدي إلى اختلال دلالة العبارة وبنائها حيث تفتقر 
الجملة الفعلية التي تقع في محل صِمَّة للاسم قبلها إلى متعلق يربطها بموصوفها 
- كأن يقال (... وقود يَسِيِرُ به هذا النوع ...) - كما أن اعتبار الفاعل ضميرًا 
مستترًا يعود على «فالكهرباء» أو «الوقود» غير مناسب دلاليّا حيث إن أي منهما 
لذ اسيراة وعد كذللك العفسير ليسي لأسباف غائلة» ...+ ووها لآ يقى 
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لدى القارئ في نباية المطاف احتمال قوي يحقق صحة الكلا 


ودلألاى أن واحدسورى 0 
د إقنافة إلى :سياف النصن الذي ترد.فية:الكلمة خل الزاسة والتعليل» يود 
سياق آخر لا يقل أهمية عنه في فك التباسها؛ آلا وهو «السياق خارجٌ النص» 
ونقصد به حقائق العالم وتفاعلاته وملابسات الأحداث المعاصرة للكلام ... 
إلخ» ومرة أخرى ومع الأسف فإنه لم يتم إلى الآن بناء قاعدة معرفية حاسوبية 
تصف بصورة مكتملة العالم المشترك بين عموم البشر''" ناهيك عن القدرة على 
حوسبة كل سياق خارجي خاص بفئة معينة من البشر كالمحامين» أو مهندسي 
الاتصالاتء أو الأدباء» أو عمال البناء» أو سكان حي معين في بلدةٍ ماء ... إلخ. 


م صرفيا ونحو 


الا 


6 


وقد تبينت أهمية هذا السياق الخارجي أثناء مناقشة المثال في النقطة السابقة» 


١-لمزيد‏ من التفاصيل حول حوسبة المعالجة الدلالية يرجى الرجوع إلى الباب السادس من هذا الكتاب حول ١‏ 


عبر الاستعارة المكزيّة). 
نوعها 2 ١‏ السابقة 
مصرّفة نظ منتظمة 1 
مصرّفة نظ منتظمة 1 


اكير 
نظن 
م 
ب طن 
م 


الصيغة الصرفية 
> 
ةك 


ولمزيد من التبيان نحلل السياق التالي (... وقد تزينت البليدة لهذا الحدث 
مهام ...) فإذا كان القارئ يعرف أن السياق الخارجي للنص يشير إلى بلدنا 
العزيز «الجزائر» (كأن يرد مثلاً في جريدة تصدر في الجزائر» ... إلخ) وكان 
يعرف أيضنا أن «التليدَة هئ ادع ندا آل تتاهب لاستقبال نتاسبة هامة 
فإنه يستطيع تقرير أن ما تحته خط ليس كلمة «الْيِيدّة» (التي قد تصف بنمًا أو 
امرأةً تتزين زينة حقيقة) وإنما هي كلمة «الْبََيْدَّة» (بافتراض علم القارئ أن 
فعل التزيّن يمكن أن يُسْنَّد إلى اسم علم على مدينة كاستخدام مجازي بلاغي 


اللاحقة | 


٠ 


لتحليل الدلالي». 


؟- تسمى مثل هذه القاعدة المعرفية «أنطولوجيا 02201087) وني الفصل الخامس «التحليل الدلالي» في هذا الكتاب 
نستعرض هذا المفهوم ونناقش أهم مكوناته وكذلك أهميته لحوسبة التحليل الدلالي. 
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ولا يسمح بنشرها ورقيا أو تداولها تجاريا 
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| الكلمة نوعها السابقة الجذر الصيغة الصرفية اللاحتة | 

ل | متف | . | مم | اه ا 
21ت 1 2 22 
ل ل 012 

١ _ 7‏ 2ر9 8 
ل سه اس 
252 1 1 

0 - 0 4 
8 له 0 00 0 0 
بطَنٍ ل , 0 7 0 
د ل ا ا 

1 7 2 8 
1 1 ال ا 
لست الل ل مت ل 


الجدول”- 1: مثال على الالتباس الصرفي عند التحليل الصرفي الآلي لكلمة «بطين». 
ومع بروز إشكالية الالتباس على المستوى الصرفي (وعلى باقي مستويات اللغة) 
كأمر لا فكاك منه بكل تحدياته التى عرضناها عالِيّه» فقد توجه المشتغلون بالمعالحة 
الحاسوبية للخات الحية إلى استعارة وتطويع أساليب التعلم الحاسوبي التي أثبتت 
فَعَالِيكها في التعامل مع مسائل صعبة وحيوية في صناعة المعلومات والاتصالات الحديثة 
مثل «معالحة الإشارات» (2506655128 518231).: و «التعرف على الأناط) (معكوط 
هتمع مع 1) ... إلخ. وبصفة عامة فإن أساليب «التعلم الحاسوبي) ((عسمتطاعة/1 
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#نطتةء.] تطبّق كأنسب ما يكون لمقارّبة المسائل التى لا تُعْرّف لما أو حيث يتعذر 
الحصول لما على «حلول بقواعد محكّمة»)( 2-00 دده -010560) » وتنطلق 
هذه الأساليب - على اختلافها - من مبدأ إمكانية التعلم عبر تكرار التعرض الغزير 
للأمثلة الصحيحة والأمثلة الخاطئة أو عبر تكرار التعرض الغزير للأسئلة وأجوبتها 
حول جزئيات المسألة المطلوب مقاربتها؛ فالطفل مثلاً قد يجيد القراءة السليمة للغة 
العربية قبل أن يتعلم أسس وقواعد اللغة من صرف ونحو ودلالة ... إلخ وذلك عبر 
تقليد الأكبر سنا وعبر محاولات الصواب والخطأ مع تصويب الأخطاء حيث يتحسن 
الأداء مع معاودّة ذلك كله مرارًا وتكرارًا. 

ويرتكز بصفة عامة تفعيل تلك الأساليب رياضيًا وحاسوبيًا لهذا المبدأ على استقراء 
السياق الاحتمالي للكلمة عِوّضًا عن سياقها اللغوي (النحوي-الدلالي) بُغْيَةَ الوصول 
إلى حساب الاحتمال الرياضي لوقوع كل تحليل تمكن للكلمة بين ما يسبقه وما يلحق 
به من كلمات ومن ثَمَّ ترجيح التحليل صاحب أكبر احتمال رياضي» وتستلزم عملية 
إجراء الحساب هذه تكوين نموذج احتمال رياضي يحاكي كل تتابعات الوحدات 
اللغوية ى) تحدث في الواقع الحقيقي لاستخدام اللغة. وفي حين أن المرجع رقم [١؟]‏ 
من قائمة المراجع نهاية هذا الكتاب يدرس باستفاضة أساليب التعلم الحاسوبي المختلفة 
بتفاصيلها الرياضية المعمّقة» فإن المرجع رقم ١[‏ 7] من نفس القائمة يستفيض في تطبيق 
بعض هذه الأساليب على معالجة اللغات الحية. 

وأيّا ما كانت الأساليب الرياضية والحاسوبية المختارة لبناء مثل هذا النموذج 
الاحتمإلي» فلا بد لها من مادة لغوية تملأ وعاءً واسعًا من الأسئلة (الكلمات الخام على 
سبيل المثال) مع أجوبتها (التحليل الصرفني الصحيح للكلمة على سبيل المثال) مثلم| 
يقتضي التعلم الحاسوي الموجّه ويطلّق على عملية تشغيل هذه الأساليب الرياضية على 
المادة اللغوية لبناء النموذج الاحتالي اسم «التدريب» (17310108) ]| يطلق على الوعاء 
الواسع الممتلئ بالمادة اللغوية اسم «المورد اللغوي) (ع116501116 1.20811286)» وبطبيعة 
الخال فإن النموذج الاحتمالي سوف يحمل الخصائص الإحصائية للمورد اللغوي الذي 
تَكَوَّنَ منه» والذي عليه بدوره أن يحمل خصائص الظاهرة اللغوية التي يعبر عنها وهو 
ما يَسُلمنا إلى اعتبارات وشروط بناء الموارد اللغوية في القسم التالي. ْ 
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هذه الطبعة إهداء من المركز 
ولا يسمح بنشرها ورقيا أو تداولها تجاريا 
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4- بناء الموارد اللغوية اللازمة لفك الالتباس الصرنى 


عبن 


أجل نجاح عملية فك الالتباس اللغوي (سواء كان صرفيًا أو غير ذلك) فإن 


النموذج الاحتمالي الرياضي للظاهرة اللغوية محل الدرس لا بد أن يحمل قدرٌ الإمكان 
ذاتَ الخصائص الإحصائية”' لهذه الظاهرة اللغوية» ومن أجل تحقق ذلك لا يُدَ أن 
يحمل المورد اللغوي بدوره قدرٌ الإمكان ذاتَ الخصائص الإحصائية للظاهرة اللغوية» 
ومن أجل ذلك يتوجب أن يتوافر فيه الشرطان الآتيان: 


3 


. 


أن تختار المادة الخام (سواء أكانت نصوصًا أم خلاف ذلك) في المورد اللغوي 
بحيث تشكل غيئةً حسنة التمقيل للظاهرة اللغوية: ويعتى ذلك أن تخطى هذه 
العينة الأبعاد الأربعة لفضاء التنوع اللغوي السالف كرما في القسم الخامس 
من هذا الفصل (وهي البعد الزمني» والبعد الجغرافي» والبعد الموضوعيء 
والبعد الأسلوبي) بحيث تتناسب أوزان تمثيل كل حيز في هذا الفضاء في تلك 
المادة الخام قَدْرَ الإمكان مع أهميتها في التطبيق الذي سيُوظّف فيه النموذج 
الاحتمالي الناتج من التدريب على هذا المورد اللغوي. 


أن تُهرَى عملية عَنْوَنة المادة اللغوية الخام لإنتاج المورد اللغوي بدقة عالية: 


ويُقصّد بعملية «العنونة» (018608طى)”" إلحاقٌ التحليلات اللغوية المناسبة 
(كالتحليل الصرفي على سبيل المثال) بكل وحدة لغوية في المادة الخام لتكوّن 
جميعها المورد اللغوي. وتنبع ضرورة الدقة العالية في هذا المقام من أن المورد 
اللغوي الناتج هو مادة التدريب (أيَّا كانت أساليب التدريب) لإنتاج 
النموذج الاحتالي الرياضي الذي تعتمد عليه آليات فك الالتباس» فإن 
كان المورد رديء الجودة فالنموذج الاحتالي الناتج عنه هو بالتأكيد معيبٌ 


-١‏ المقصود بالمخصائص الإحصائية للظاهرة اللغوية هو التكرارات النسبية لوحداتها اللغوية في واقع تطبيق هذه 
الظاهرة اللغوية. 
3 تشيع أيضًا لفظة ااتوسيم) لتر حمة المصطلح 01210100 تتحتخر) . 
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وبالتبعية يصير أداءٌ آلية فك الالتباس المعتودة عليه رديئاء ويُعَدٌ هذا تجليًا 
لمبدأ في الرياضيات الحاسوبية مؤداه أن «معالجة النفايات المدتحلة لا تَحْرِحُ إلا 
النفايات) (0101) 315386 - 152 ©023150386) ويعرف بالاختصار «2)061000. 


ومن النماذج الجيدة على بناء الموارد اللغوية العربية الحديثة ما جاء في الورقة المشار 
إليها برقم [؟؟] فى قائمة المراجع نهاية هذا الكتاب والتي تناولت عدة أصناف من 
الموارد اللغوية التي تم إنجازها بالفعل؛ منها النصية ومنها الصوتية ومنها المختلطة. 

ومن الجدير بالذكر في هذا المقام أن إعداد وعنونة المواد اللغوية الخام - سواء كانت 
نصية أم لاء والتي تسمى اصطلاحًا «مُدَوّنات» (00700:8)لإنتاج الموارد اللغوية 
قد صار منذ بداية القرن الحادي والعشرين الميلادي نشاطًا ذا حجم كبير في أبحاث 
وصناعة تطبيقات معالجة اللغات الحية بمختلّف أصنافهاء وقد يتخطى حجم هذا 
النشاط أحيانًا الخمسين في المئة ضمن كافة أنشطة معالجة اللغات الحية من معالحات 
رياضية وتصميم وبناء البرمجيات 0 لتنفيذها ... إلخ» » وهو ما أدركه المجتمع 
العالمي المشتغل بهذا المجال فقام بتخصيص أكبر مؤتمراته للموارد اللغوية وبمختلف 
الوا حت االو برل رطفا دقر باس 60 ويُعْقَد بوتيرة منتظمة مرةً كل ستتين 
منذ عام 444١م‏ ويتراوح عدد حضوره في كل من دوراته ما بين الألف والألفين من 
المتخصصين كما يتجاوز عدد مساراته العشرين مسارًا كي تغطي مختلف أنواع وأنماط 
الموارد اللغوية ع4.01مء-ع1771577.126/ / :طاغط. 


إعداد المدّوّنات اللغوية وبناء الموارد اللغوية بمختلف أنواعها هو أحد أكبر الأنشطة في 
مجال أبحاث وصناعة تطبيقات معالجة اللغات الحية . وبسبب ضخامة حجم المادة وارتفاع 
دقة العنونة المطلويّيْن لكل من هذه الموارد اللغوية» فضلاً عن التنوع الواسع لأصناف هذه 
الموارد» إضافة إلى قلة عدد الموارد اللغوية التي جرى إنجازها بالفعل في حقل اللغة العربية» 
فإن هذا النشاط يستدعي أن تنخرط فيه أعداد كبيرة ال الرضل لكان 
لل ل لا ل لل ف ل ران تر ررس 
تأليف هذا الكتاب. 


- أدوات وبرمجيات ومعايير 
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هذه الطبعة إهداء من المركز 
ولا يسمح بنشرها ورقيا أو تداولها تجاريا 
+ ب ب ب ب #ط#ط# لط غ سيا 


يعدن يشكل واقيي إخراء عملية كاه الوارد اللغوية عل نويفه الحموم تشارح إطار 
تنظيمي يضبط اطّراد واتساق عنونة المدوّنات اللغوية (مثل التحليل الصرفي لكلمات 
المدونة) من مُعَنوِنٍ لآخرء ويدعم في الوقت نفسه كفاءة العنونة ودقتهاء ويتيح كذلك 
مراجعتها ومراقية نسبة الإنجاز ... وغير ذلك من وظائف. رقا اه لقي دل إطار 
موطل ذه ال اأمطر يهل هيد ونام حاسري. لير ريف ة قذامي 7 يُسَمَّى (أداة عنونة» 
(100[1 متام صسم) . 


ويعرض الشكل رقم (2-1) أدناه لقطة أثناء تشغيل إحدى هذه الأدوات التي تمكن 
اللغويين من إدارة وعنونة المدونات النصية العربية من النواحي الصوتية (الفونولوجية) 
والصرفية والدلالية وذلك بأسلوب تفاعلي عبر واجهة استخدام رسومية مفصلة تتيح 
ا 


القاس الورقيم 


ا 


هه عه 2 2 لام أهة مسف اال ضام 5 12 7 ار . 0 
الْتر 9 كب 3 | ادل | لس رات بره الشعو ب ع[ 1 ور م اق وكدور ر حول: 
العامة و عنيلة اميك 2 عادخ ابحموب لععهٍ 


- مي د يه 


تَعَالى (وئرئى 39 متخي خوخ زع كذ” 


-١58- 


الشّكل *-5: لقطة من أداة عنونة النص العربي صوتيًا وصرفيًا ودلاليا؛ «قَصبيح)70©. 


وفيضن عل طييعة عفن المزا زه اللغوية أذوائةالضينة الليسفدي لاعاهها عه 
مُعتوِدةٍ في وظائفها على لغة محتوى هذه الموارد (مثل بعض أنواع الموارد اللغوية للكلام 
المنطوق) فتكون تبعًا لذلك مثل هذه الأدواتٍ قابلة لإعادة الاستخدام في أغلب 
الأحيان بين لغة وأخرىء فإن طبيعة بعض الموارد اللغوية الأخرى (وخصوصًا تلك 
النصية» أو تلك التي يشكل النص ركنًا أساسيًا فيها) تحتم إنشاء أدوات عنونة جديدة 
تراعي خصوصيات لغة محتوى هذه الموارد» وتقع أدوات عنونة المدّوّنات النصية العربية 
بمختلف أنواعها ضمن الفئة الثانية» وبنظرة عامة على الحالة الراهنة للأدوات العربية 
من هذه الففئة الثانية تتضح لنا المساحات التالية التي تتسع لإسهامات اللغويين العرب: 


-١‏ يمكن الرجوع إلى تفاصيل هذه الأداة التفاعلية في الورقة المشار إليها برقم ]١17[‏ فى قائمة المراجع نهاية هذا الكتاب. 


ات 


هذه الطبعة إهداء من المركز 
ولا يسمح بنشرها ورقيا أو تداولها تجاريا 
:اا ال ييا 


* بالقياس إلى الكثير الذي يُرتقَب إنجارّه والقيام على تحديثه من مختلف الموارد اللغوية 
العربية النصية (أو تلك التى يُعتبر النص العربي ركنًا فيها) يُحَدَ ما جرى بناؤه من أدوات 
00 
المطلوبة لبناء الأدوات 0 هناك كذلك حاجة إلى إسهام من ناحية اللغويين 
العرب وخصوصًا فيم| يتعلق بتصميم واختبار واجهات الاستخدام وتفاعليتها. 

؟ وحتى بالنظر إلى أدوات العنونة العربية التي تم بناؤها بالفعل فإن استخدامها لا يزال 
غير شائع إلا على نطاق محدود» ومرجع ذلك في كثير من الأحيان هو أن ملكيتها تعود 
إلى الشركات التى طورتباء ولذلك فإن هناك حاجة للعمل على التوعية بالآدوات الجيدة 
ل ل ا ار مك ل قات أاط 
مبتكرة من تعويض الشركات لإقناعها بإتاحة أفضل ما طورته من أدوات العنونة 
العربية للاستخدام الحر أو مقابل رسوم زهيدة» وهو ما يحتاج إلى جمعيات/ تنسيقيات/ 
تكتلات من المشتغلين بأبحاث وصناعة تطبيقات المعالجة الحاسوبية للغة العربية بمن 
فيهم اللغويون. 

* إجراء رصد دوري شامل لكل ما يُطرّح من أدوات العنونة العربية مع نقد وتقييم أداء 
كل منها ومن نَّمّ ترشيح الأفضل من بينها لإنجاز كل نوع من الموارد اللغوية العربية» 
فضلاً عن إجراء رصد أوسع لأدوات العنونة غير العربية ذات البرمجيات مفتوحة المصدر 
ما قد يمكن تطويعها بجهد معقول لإنتاج الموارد اللغوية العربية» ومثل هذه الأرصاد 
والتقيبمات تحتاج أيضًا لحهود منظمة من جمعيات/ تنسيقيات/ تكتلات من المشتغلين 
بأبحاث وصناعة تطبيقات المعالجة الحاسوبية للغة العربية بمن فيهم اللغويون. 

أما بالنظر إلى الوضع الراهن لبرمجيات التحليل الصرفي العربي بِشِقَيْها؛ٍ الأول المختص 

باستخلاص كل التحليلات الصرفية الممْكنة لأية كلمة عربية والثاني المختص بفك 

الالتباس الصرفي» فإن تاريخ العمل على هذه المسألة من بحث وتطوير والذي يمتد 
منذ سبعينات القرن العشرين الميلادي قد أثمر عددًا كافيًا من حزم البرمجيات الناضجة 
بمستوى تطبيقي صناعي وذلك مع نهاية تسعينات القرن العشرين الميلادي» حيث 
وصل هامش الخطأ في الشق الأول إلى ما دون الاثنين في الألف كما وصل هامش الخطأ 
في الشق الثاني إلى ما دون الخمسة في المئة بعد التدريب على ذخيرة صر فية عربية متوازنة 


ددم اله 


التغطية للفضاء اللغوي ذات حجم ثلاثة ملايين كلمة ”© وذات جودة عنونة رفيعة 
لا يزيد هامش الخطأ فيها عن خمسة في الألف. وفي حدود هوامش خطأ محدودة كهذه 
أمكن بناء تطبيقات صناعية ترتكز على التحليل الصرفي العربي الآلي وذات أداء مقبول. 
ويجدر بنا الإشارة في هذا المقام قبل أن نختتم هذا الفصل إلى بعض الأعمال 
التى اشتهرت وشاعت بين الباحثين في جال المعالجة الآلية لِلْغة العربية؛ 
فلدينا المحلل الصرفي العربي الذي اشتهر باسم مصممه الأسامي اتِيمْ باكْوُولَ) 
(متاخط.لاع 010طام15.018/201تطة110://17/17/17/.0ط) عله تكاعدا8 دمن الذي يمكن 
الحصول عليه من خلال «مُوّسّسة (1100) 0تناةازدكم00 0318[ عتاكتداومنآ» في 
جامعة «بتْسِلْفَانيا بالولايات المتحدة الأمريكية أثناء عمله فيها وذلك عبر //:ماغط 
9--21010-1)ه00مو [.7 ماع 621210 /ع 011/621210»ع . متطاع مرنا. ع1 .11117 
والنسخة الشائعة منه هي الإصدارة ١,١‏ التي ظهرت في نوفمبر عام 7١٠7م‏ ويمكن 
الحصول عليها بالمجان للمشتركين في الجمعية أو بمقابل رمزي لغير المشتركين فيها. 
كما أن هناك حزمة الأدوات البرمجية المعروفة باسم «مَدَى وطُوفَان؛ (+0/1424 
101417) والتي تعمل على معالجة النص العربي الخام لاستخراج أنسب المعلومات 
الصرفية والمعجمية والصوتية والأنواع الكلامية لكل كلمة بمراعاة السياق المحيط بهاء 
وقد تم تطوير هذه الحزمة في جامعة ١كُولُومْبيا'‏ بالولايات المتحدة الأمريكية ويمكن 
الاطلاع على تفاصيلها في الورقة المشار إليها برقم ]١9[‏ فى قائمة المراجع نباية هذا 


-١‏ وقد ينخفض هامش الخطأ في فك الالتباس الصرفي الآلي إلى ما دون الثلاثة في المئة مع ذخيرة صرفية بنفس الحجم 
ولكنها مركزة في حيز ضيق من الفضاء اللغوي («النصوص القانونية المعاصرة في مصر» على سبيل المثال)» كما يُعتَقد 
أنه دون الاستعانة بتحليلات صحيحة من طبقات لغوية أعلى (كالدلالة والنحو على سبيل المثال) يظل هناك حدٌ أدنى 
لهذا النوع من هوامش الخطأ لا يقل عن الثلاثة في المئة مهما زاد حجم الذخيرة اللغوية الصرفية التي جرى تدريب آلية 
فك الالتباس عليها. 


-111- 


هذه الطبعة إهداء من المركز 
ولا يسمح بنشرها ورقيا أو تداولها تجاريا 
)ُ6ا ييا 


الكتاب. 
كما تعالج حزمة الأدوات البرمجية المعروفة باسم «أمِيرَة» .47/111:4)) كلمات النص 

العربي لتعيين لواصقها وتحديد أنواعها الكلامية وتقسيم النص إلى أقصر عبارات غير 

متداخلة في شجرة تحليله الإعرابي» ويمكن الاطلاع على تفاصيلها في الورقة المشار إليها 

برقم [18] فى قائمة المراجع نهاية هذا الكتاب. 
ومع عدم الحاجة للمزيد من الأبحاث في مسألة التحليل الصرفي العربي الآلي» فإنه 

لاتزال هناك ضرورة للعمل من أجل تحقيق الأهداف التالية: 

* الاتفاق على معيار موحد لمدحَلات ومُرّجات برمجيات التحليل الصرفيء مما يسمح 
بتعظيم فرص إعادة استخدامها في التطبيقات الصناعية» أو وديجها في آليات أوسع 
للمعالجة الحاسوبية لِلّغْة العربية. 

* الاتفاق على معيار موحد وعلى عينة اختبار موخٌّدة لأداء برمجيات التحليل الصرفي 
العربي ما يُمَكّن من المقارنة العادلة يَيْنّها. 

رصد كل ما يمكن الوصول إليه من برمجيات التحليل الصرني العربي - وخصوصًا تلك 
المتاحة بالفعل للاستخدام الحر - فضلا عن اقتراح أناط مبتكرة من تعويض الشركات 
لإقناعها بإتاحة أفضل ما طورته من المحللات الصرفية العربية الآلية للاستخدام الجر 
- أو مقابل رسوم زهيدة - بل وحتى طرحها كبرمجيات مفتوحة المصدر. 

* كل ما سبق من أعمال يحتاج أيضًا لمهود منظّمة من جمعيات/ تنسيقيات/ تكتلات من 
المشتغلين بأبحاث وصناعة تطبيقات المعالجة الحاسوبية للغة العربية بمن فيهم اللغويون. 


ببليوجرافيا مرجعيّة 


.١‏ ابن فارس (أبُو الحُسَيْنِ أحْمَد): مَقاييس اللْعَّة تحقيق: عَبّْدالسَّلام هارون» ط71. 
مم 


أ ابن قطرر (أنو لتقن جال الذيه) لبان العذي» ذا فاقيل: تروط 
“.0 الدّخداح (أنْطُوان): مُعْجَمْ قَواعِدِ العَرَبيّة العاليّة مَكْتَبَة نان ط١ء‏ ٠1994م.‏ 


4. الرّاجحيّ (عَبدُه): التّطبِيقٌ الصَرْفٌ دارٌ المغرفة الجاوِيّةء الإسْكَنْدريّة 1491م. 


- 11:5 


6 رضا (أحمد): مُعْجَم مَدْن اللَعَّة أَحْمَد رضًاء مَكْتَبَّة الحيّاة بيُروت» 1امم. 

0 الزّيبديّ (حَمّدٌ مُزتقى) : تاج العروس مِنْ جواهرٍ القاموس. طَبّعة وَزَارة ال علام 

0 العاني (سَلمان حَسَن): فونولوجيا العربيّة» - ترجمة ياير الملّاح» دار التّادي الأَدَيّ 
بجدّة - المملكة العرَبيّة السّعوديّةَ “19/17م. 
ده 2 0 و ا اند دفر ع بيو 5 
الإسلاميّق “19417م. 

4 عُضَيْمة (حمّد عَبْدُ الخالق): المْنى في تضريني الأفعالء دارٌ الحديث. 


.٠‏ الفارايّ (أَبُو إبْراهِيمَ إِسْحاقٌ ابْنّ إبراهيم): ديوان الأدب, تحقيق: أَحْمَد مختار 


عمر» 14ام. 
.١‏ قياض (سُلَيان): الحُقولٌ الدَّلَالية الصَّرْفيّةُ لأفْعالٍ العَرَبيّة: دار المرّيخ بالرّياض» 
م 
1 


3 ْم ال لعي بالقاهرة» المعْجمُ الوَسِيطٌء طلاء 19468م. 

. ممع الع ا بالقاهرة» ما تَمّ مِنْ (المعبججم الير)» طااء: حداف الألف 
6 2 الباء »١940١‏ حرفا النّاء والثاء 7 , حرف الجيم بيرك 
2*7 الجحاء 5٠٠٠‏ 80 الخاء 5 .»5٠٠١‏ حرف الدال .5٠0٠١5‏ حرف الذال 
حرف الرّاء ١6‏ ١5م.‏ 

3 م الكو اك بالقاعرق فلك الفا القران الكوري با د م 

عاطوعذ عطا 01 01ووعع20 0123110231امططهن) علو 5-عع31آ ل .14 ,13كث .15 


001011 01 .أمع10 ,قأوعط) .81.5 ,كمه0دء1[ممك لله روع10مطم1ه831 
.0 ,011151[] 00110 ,5 لااعع طاع اط 01 7جا1ناعة] ,رعطتاعع0- اعمط 


-10تتك- [لطاء 5 2 ز©2ع1"2551 ,./ط ,83013511057 -1ث ,./ط به تكط5ة ]1 ,./1 روث .16 
-0ط روع12 -205 ولوع1ع010طم1/101 عط :101 1001 ع تكتاعوتاعغم] لباكلا علأمططر 
1111-5 رأكته 1 ع1طو مث عط 01 012101 نمف ع اأطتةحاء 5 20ة ,عتاعم 


خع- 


هذه الطبعة إهداء من المركز 
ولا يسمح بنشرها ورقيا أو تداولها تجاريا 
:ا ييا 
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الفصل الرّابع 
التُحليل التّركيبيَ 


هه 


د. سامح الأنصاري 


؟- علاقة منظومة النحو بمنظومتي الصرف والمعجم. 

"- مدخل إلى تركيب الجملة في علم اللغة. 

- مدخل إلى معالجة تركيب الجملة آليا. 

ه- اتجاهات بناء المحللات النحوية. 

5- دقة المحللات النحوية. 

/ا- أمثلة للمحللات النحوية. 

8- بعض النقاط البحثية ال هامة من أجل دعم خطة طريق لمعالجة التركيب في اللغة 
العربية. 


وماك 


هذه الطبعة إهداء من المركز 
ولا يسمح بنشرها ورقيا أو تداولها تجاريا 


نااك 


-١‏ تقديم 
إن تناول قضية التحليل النحوي والمعالجة الآلية لتركيب الجملة في اللغة العربية 
موضوع متشعب الأبعاد والجوانب نتيجة لخصوصية طبيعة اللغة العربية» حيث إن 
منظومة النحو تندرج فيها العديد من النظريات النحوية القديمة والحديثة» بالإضافة 
إلى ارتباطها ارتباطا وثيقا بمنظومتي الصرف والمعجمء ولا مناص من مناقشة التفاعل 

بينهم؛ التفاعل الذي يصل إلى حد الاندماج الكامل. 

وتعتبر عملية التحليل النحوي الآلي من ركائز المعالجة الآلية للغات الطبيعية» حيث 
يجري فيها تحديد بنية الجملة من حيث هيكلية مكوناتها ووظائف عناصرهاء وإيجاد 
قالبها النحوي اعتمادًا على القواعد النحوية الأساسية من حيث تقسيم الجملة وتحديد 
مكوناتها وتقسيم كلماتها لإيجاد العلاقات النحوية فيم| بينها. ويعد المحلل النحوي الآلي 
مقومًا أساسيًا لا غنى عنه. حيث تعتمد عليه العديد من تطبيقات معالجة اللغة مثل 
التطبيقات الخاصة بتحليل مضمون النصوص وفهمها آليا وعمليات الاستخلااص 
والتلخيص والفهرسة الآلية» ونظم الترحمة الآلية» وتطبيقات اكتشاف الأخطاء 
المجائية والنحوية آليّا. 


وقبل التعرض لآليات التحليل النحويء لا بد من النظر - بشكل عام ودون التقيد 
باتجاه معين - إلى مفهوم القواعد النحوية وكيفية التعبير عنها وتمثيلها وآليات تحليل 
مكوناتهاء فنحو اللغة كان أحد موضوعات البحث منذ وقت طويل في أبحاث علوم 
اللغة والآداب. ونظرًا لطبيعة النحو التي تميل إلى التجريد والاختزال» فقد أصبح 
النحو - كم| ذكر الذكتور نبيل علي - «خط الالتقاء بين اللسانيات والرياضيات (علي» 
4. ومؤخرًا قدم مجال علوم الحاسب رؤية جديدة للتمثيل النحوي؛ وهي أن 
التركيب النحوي يمكن تعريفه على أنه نتاج عدد من العمليات الحسابية والتي يمكن 
من خلالها صياغة قواعد النحو في صورة قواعد رياضية» يمكن من خلاها توليد عدد 
اجات دن راكب اللدرية الستمويم يا اللكة: 

فيهدف هذا الفصل إلى تقديم بعض المفاهيم الأساسية المتعلقة بتركيب الجملة 
لترسيخ مفهوم التحليل النحوي» وتوضيح أهدافه. فسيسعى هذا الفصل أيضًا إلى 
توضيح مفهوم القواعد والقدرة التوليدية للقواعد وقياسها وإلقاء الضوء على الفارق 


-11/- 


هذه الطبعة إهداء من المركز 
ولا يسمح بنشرها ورقيا أو تداولها تجاريا 
:ا ييا 


بين بعض الاتجاهات المختلفة للتحليل النحويء واستعراض التحديات التي تواجهه 
في اللغة العربية بشكل خاص. ثم يتم رصد بعض المحاولات السابقة لبناء المحللات 
النحوية الآلية. ويل ذلك عرض عام لتقديم المحلل النحوي التفاعلي (ع"اناع6]8امآ1 
آال14آ- 217261 مشاكيفية عمله. وينتهى هذا الفصل بالتعرض للعديد من النقاط 
اللحية اتامايع أجل ون عالطا رون امال اللركيبو ف اللفة الغربية 


"- علاقة منظومة النحو بمنظومتي الصرف والمعجم 

تعتبر اللغة العربية من أعقد اللغات في عائلتها ومن أغناها صونًا وصرقًا ومعجً 
ونحوًا. وما لا شك فيه أن النظر إلى طبيعة منظومة النحو العربي يستدعي التطرق إلى 
طبيعة منظومة الصرف. إذ أن العلاقة العضوية بين الصرف والدر انضية رقن 
نفسها على كل من الساحة اللغوية الوصفية وساحة المعالجة الآلية للغة على حلٍ سواء. 
وقد تصل عملية التفاعل بين المنظومتين إلى حد الاندماج الكامل إلى الدرجة التي 
يصعب فيها تحديد أين تلتقيان وأين تفترقان. فعلاقة النحو بالصرف نقطة تحول كبيرة 
في النظرية النحوية الحديثة» فقد قام تشومسكي”' بإدراج «الصرف بأكمله في منظومة 
النحو في نظريته القياسية؛ حيث نظر تشومسكي إلى عمليات التكوين الصرفي للكلمات 
بصفتها عمليات تحويل نحوية» (علي؛ 1988). فالجمل ليست مجرد تتابع للكليات: 
بل هي هيكلية تتعدد مستوياتها وتتداخل. ونعني بذلك مثلاً أنه من غير الممكن تصور 
إمكانية تحديد اللواحق الصرفية دون معرفة الموقع الإعرابي للكلمة فعلى سبيل المثال لا 
يمكن معرفة أن اللاحقة الصرفية المسئولة عن تعيين الجمع المذكر لكلمة) معلم) هي 
(مون) أم (دين) دون النظر إلى الموقع الإعرابي للكلمة داخل الجملة كي في »)١(‏ (7): 


حضر المعلم(ون) إلى الاجتماع. )01 
كافاً المدير المعلم(ين) القدامى. إفه 


ويمكن أيضًا أن يكون للصيغة الصرفية الواحدة أكثر من وظيفة نحوية. فإذا 
نظرنا إلى اللاحقة الصرفية (ست) الملحقة بالفعل (كنت) فقد يشعر القارئ بالغموض 


-١‏ درس نعوم تشومسكي في مجالات متعددة وهي مجالات اللّسانيّات والرياضيات والفلسفة وهو مؤسس النظرية 
التوليدية التحويلية. 


-١78- 


كن(لت) أعمل على الورقة البحثية أمس. إفرة 
كن(لت) تعمل على الورقة البحثية أمس. 05 
كن(لت) تعملين على الورقة البحثية أمس. 00 


فيصعب تحديد نوع التاء الملحقة بكل فعل - هل هي تاء الفاعل للمتكلم (كنتٌ) 
كما في ("37) أم تاء الفاعل للمخاطب المذكر (كنتّ) كما في (5) أم تاء الفاعل للمخاطب 
المؤنث (كنتٍ) كما في (5) - دون معرفة الفاعل في البنية التركيبية لكل جملة. وعلى ذلك 
فإنه ليس من المتصور أن تتم دراسة التركيب النحوي للجملة بمعزل عن التركيب 
الصرفي للكلمات. 

كا أن علاقة النحو بالمعجم علاقة محورية في منظومة اللغة لما يزودنا به من أبنية 
الأساء والأفعال وصيغ الاشتقاق. فلم يعد المعجم كيانًا مستقلاء بل هو مصدر لإمداد 
النحو بالمفردات التي تغذي المنظومة النحوية ولتحديد أنواع هذه المفردات والفئات 
التي تنتمي إليها. فعلى سبيل المثال جملة (حضر الطالب متآخرًا إلى المدرسة) نجد أنه لا 
يمكن التطرق لتحليل الجملة ووصف تركيبها دون تحديد الفئات التي تنتمي إليها كل 
كلمة وتعيين سماتها الصرفية. وهنا يأ دور المعجم المسئول عن هذه الوظيفة ليمدنا بمثل 
هذه المعلومات: حضر: فعل )(17) طنن7؟). ال: أداة تعريف (061)1(0111(0تمطتاعاء12), 
طالب: اسم ((8) تناه[8), متآخرًا: حال (/881) 80065)). إلى: حرف ) 
(05111035م2:2)» مدرسة : اسم (/2). ويجب أن ننوه أن علاقة النحو العربي بالمعجم 
تتم - في معظمها - من خلال الصرف وذلك نظرًا للثراء الاشتقاقي الشديد للصرف 
العربي('". والخلاصة أن السمات الصرفية النحوية هي إحدى الركاتز الأساسية التى لا 
لضا تضياظة العدر العو والتداند الكره القة” ْ 


-١‏ «الجملة العربية ما هي إلا نتاج التفاعل بين إسقاطات كلمتها النحوية والمعجمية». 


وا 


هذه الطبعة إهداء من المركز 
ولا يسمح بنشرها ورقيا أو تداولها تجاريا 
:6 ا | ييا 


*- مدخل إلى تركيب الجملة في علم اللغة 

تتكون اللغة من مجموعة من الحروف التي تتكون منها الكلمات والتي بدورها 
مسئولة عن تكوين الجمل» وتختلف كل لغة عن الأخرى في العديد من الخصائص 
اللغوية ومن أهم هذه الخصائص ترتيب الكلمات. فلكل لغة تركيب نحوي أي توزيع 
منتظم غير عشوائي للعناصر المكونة لكل جملة؛ ويتم ذلك التوزيع من خلال مجموعة 
من القواعد؛ مسئولة عن تحديد هيكل الجملة وترتيب عناصرها وتوصيف وظيفة كل 
عنصر. فعلى سبيل المثال في اللغة الانجليزية يأتي الفاعل قبل الفعل بين) يأتي المفعول 
به بعد الفعل ويسمى هذا التركيب (510) أءء[ا0- طانع/ا- أءوزطن5)) ولكن 
الوضع ليس كذلك في كثير من اللغات الأخرى فقد يأتي الفاعل والمفعول قبل الفعل. 
لذلك فإن أحد الوظائف المامة للقواعد هى توصيف كيفية التعبير عن تركيب الجمل. 
وكنلاف لوسك فراع اللعة "عل أنا عكرق من ثلاث مكونات أساسة وه: 
القواغد التحوية ورقرم ذا المكرن بعحديد العو اعد الاركبيية البحووة لزر اكيب ادل 
تركيبا سلي) في اللغة. والقواعد الدلالية والتى تحدد كيفية تفسير معنى الجمل. والقواعد 
الفرتؤلوجية وعو لكر تجرد للتظام الوق اناك اليعائب اللطزة يمن اللقة: رلا 
بد هنا أن ننوه إلى أن فقّدان المكون المورفولوجي من ضمن تلك المكونات يرجع إلى أن 
تشومسكي يتبنى الفكر الذي يزكي كون المكون المورفولوجي يتداخل ضمن المكونين 
النحوي والفونولوجي (1993 ,2008ة1ة؟1). 

وبالنظر إلى مُكون القواعد النحوية- قضيتنا الأساسية في هذا الفصل- فإن هذا 
المكون يجب أن يؤدي وظيفتين جوهريتين وهما؛ أولا: القدرة على التوليد والتحليل 
الصحيحين لكل الجمل الصحيحة فقطء ثانيا: تعيين البنية النحوية المناسبة للجمل 
المعنية بالتحليل مع الأخذ في الاعتبار الملكة اللغوية ” لابن اللغة وإدراكه للعلاقات 
النحوية بين الكلمات في هيكل الجملة .وقبل الخوض في تفاصيل هاتين الوظيفتين لا 
بد من إلقاء الضوء على مفهوم (التركيب النحوي) للجملة وكيفية تمثيل هذا التركيب 
-١‏ كلمة قواعد تعني وصف اللغة من حيث هي واقع قائم بذاته وصفا موضوعيا وبإمكانها توليد جمل اللغة أي وصف 

جمل اللغة بصورة بينة وجلية فمع نشوء اللَسانيّات وتطورها لم تعد كلمة قواعد تعني القوانين التي يجب اتباعها 

للتعبير والكتابة بحسب الأصول. 
؟- الملكة اللغوية: هي جزء من كفاية الإنسان» أي جزء من معرفته الضمنية بقواعد اللغة. 


00-6 


والقواعد المنظمة لهذا التمثيل. ويعد التمثيل ال هرمي من أنجح طرق التمثيل التركيبي 
للجمل الطبيعية وذلك لأنها تحاكي الملكة اللغوية لابن اللغة الذي لديه معرفة بديهية 
رقي امل اق لقم عدره عل ركاف عر ايف جحي از امن الفعر ف عل 
مجموعة معينة من الأصوات يمكن أن تكون كلمة صحيحة قائمة بذاتها منفصلة عن 
تتابع آخر» ويستطيع ابن اللغة أن يدرك أن تتابع الكلمات يمكن أن يشكل مكون أو 
مركب أكبر وهو الوحدة المكونة للجملة؛ فعلى سبيل المثال يمكن تمثيل تيار أصوات 
الجملة في (7) بدون مسافات. وهنا نجد أن أي ابن للغة العربية لديه ملكة لغوية تجعله 
قادرا على تميبز وتقسيم تلك التتابعات الصوتية الموجودة في (5) إلى تلك الموجودة في 
(0) بشكل غير واع: 

الطالبحضرمتأخرا 030 

الطالب حضر متأخرا إلى المدرسة(١).‏ (7) 

ل ل ل 
تمتد لبيان الرابط التركيبي بين الوحدات» فيستطيع أن يتعرف على العلاقة الوثيقة بين 
«ال» و «طالب»؛ وهي من نفس نوع العلاقة التي تربط بين «ال») و«مدرسة» حيث ترتبط 
«ال») ب «مدرسة» وليس بالوحدة التي تسبقها «إلى» ىا هو مبين في الشكل .)١-5(‏ 


1 , 
ال طالب حضر متأخرا إلى ال مدرسة 


الشّكل 4 :١-‏ بيان الرابط التركيبي بين الكلمات. 


وبالمثل يعرف ابن اللغة بشكل غير واع أن «المدرسة» مرتبطة ب (إلى» لتمثا وحدة 
أكبر كما هي ممثلة في الشكل (7-4). 


ال طالبت حضر متأخرا إلى ال" مدرسة 
الشّكل 4 -": الرابط بين «المدرسة» و «إلى». 
١‏ - وفقًا معيارية الل اعربيّة يُبرض أن يُقَدم الفعلُ على الاسم في هذا التّمط الّكيييَ . ومع هذا يجورٌ تقديم الاسم 


على الفعل» »كا في قوِهِ تعالى إوالله يَصِمُكَ مِنَ اناس 4 [المائدة/ /31] . وقد آثَرَالموَلَفُ التَّمثِبلَ مبذا النّمط لتيسير 
فهم القاعدة على اللّغات الإنسانيّة عُموماء حيث يشيعٌ تقديمُ الاسم على الفعل. 


-١51- 


هذه الطبعة إهداء من المركز 
ولا يسمح بنشرها ورقيا أو تداولها تجاريا 
:ا ييا 


وتمتد هذه القدرة لتربط «حضر» و ١متأخرا»‏ و(إلى المدرسة» كوحدة واحدة كا في 


الشكل (5-5). 
م 


ال طالب حضر متأخرا إلى ال مدرسة 


الشّكل 5 -": ربط احضر) و«متأخرا» و(إلى المدرسة» كوحدة واحدة. 
وأخيرًا تتابع الكلمات «الطالب حضر متأخرا إلى المدرسة» يمثل وحدة واحدة قائمة 
بذاتهبا ىا هي ممثلة في الشكل (5-5) والذي هو عبارة عن تمثيل تخطيطي لما يدور في 
عقل ابن اللغة عن العلاقات النحوية بين سلسلة الكلمات المتتابعة ويبرز قدرة ابن اللغة 
على تحديد الوحدات التى تتكون منها الحملة في (/17). 


ال طالب حضو متأخرا إلى ال مدرسة 
الشّكل 4 -:: تمثيل تخطيطى للوحدات التى تتكون منها الجملة .)١(‏ 

كذلك تمتد قدرة ابن اللغة ليستطيع التعرف على الوحدات التي لها نفس الفئة وذلك 
من خلال ملكته اللغوية الذي يمتلكها؛ فعلى سبيل المثال فإنه يستطيع أن يدرك بديهيا 
أن «طالب» و «مدرسة» وحدتان تنتميان لنفس الفئة والتى تختلف تهاما عن فئة الكلمة 
«حضر» وذلك لأن كلا من «طالب» و «مدرسة» اسم؛ ولكن «حضر» فِعل. ويستطيع 
أيضا ابن اللغة أن يدرك أن «متأخرا» لما فئة مغختلفة وهى حال والتى تختلف عن فئة (إلى) 
وهى حرف وكذلك «ال» التى تسبق «طالب» هى نفسها تلك التى تسبق «مدرسة» 
ويطلق عليههما أداة تعريف. وتعرف هذه الفئات بالفئات المعجمية. 

ويمكن كذلك لابن اللغة أن يدرك فئة الوحدات الأكبر ويميزها عن غيرها من 
الوحدات داخل الجملة؛ فهو يستطيع -على سبيل المثال - أن يدرك أن «الطالب» 
و«المدرسة» وحدتان لما نفس الفئة وهى مركب اسمى ((812) 11856م 2تاه210) 
ويطلق عليه ذلك لأن فئة رأسه (اسم)؛ وأن الوحدة «إلى المدرسة» تُشكل مركبًا حرفيًا 


-١515- 


وسمي حرفيًا رم تت س1 كذلك لأن فئة رأسه (حرف)؛ وأن 
«حضر متأخرا إلى المدرسة» 15 مركن 8 ((1/2) عمقتنام 1161621)» وسمي كذلك 
لآن فئة رأسه (فعل)» وأخيراء أن التتابع «الطالب حضر متأخرا إلى المدرسة» ل 
الوحدة الأكبر التى يطلق عليها (الجملة) ((5) 568:6006)؛ وتعرف هذه الفئات 
بالفئات العبارية 5 لومقخط2) . 


وهذا الفكر يطابق ما عرفه اللغويون بالوسم العباري (2/31162 ءودمط2) الذي 
يعرف اختصارًا ب (2-12081161)؛ وهو يمثل الميكل التركيبى للجملة في شكل تتابع 
هرمي من الكلمات هذه الكلمات تشكل مركب (215356) وتتابع المركبات يكون جملة. 
ويتم توصيف هذا الميكل التركيبي في شكل تمثيل شجريء ومثال على ذلك جملة (حضر 
الطالب متأخرا إلى المدرسة): يتم أولا تعيين الفئة التي تنتمي إليها كل كلمة في الجملة 
وذلك يتم من خلال المعجم. ف «الطالب» تتكون من أداة التعريف «ال» والاسم 
«طالب» والفعل «حضر» والحال «متأخرا» وال حرف «إلى» أما #الذرسة "كرون من 
أداة التعريف «ال) والاسم «مدرسة» ى في الشكل (0-5). 


1ط لم 17 ثاللث 2 [81ط 1‏ ١م‏ 
ال طالب حضر متأخرا إلى الب مدرسة 


الشّكل 5-4: فئات الكلمات التي تتكون منها الجملة (1). 

ويتم بعد ذلك جمع الكلمات التي تشكل مركبات» فنجد أن أداة التعريف «ال) 

تكون مع الاسم «طالب» مركبًا اسميًا وأداة التعريف الأخرى «ال» تكون مع الاسم 
«مدرسة» مركا 20-7 في الشكل (5-5). 

طاحم طاح 


الذزها )1 7 عثاآللث 2ر2 1ط[ )1 
ال طالب حضر مَتأخرا إلى ال مدرسة 


الشّكل 5-4: ربط الكلمات التي تشكل مركب اسمي. 


- ١ 


هذه الطبعة إهداء من المركز 
ولا يسمح بنشرها ورقيا أو تداولها تجاريا 
:ا ييا 


وأن المركب الاسمي «المدرسة» يكون مع الحرف (إلى» مركبًا حرفيًا (57) كما في 


الشكل (5-/0. 


20 


27 


الام 
متأخرا 


م 81م 
إلى ال 


الشّكل 4 -/: تكوين المركب الحرفي «إلى المدرسة». 


0 


وأن الفعل «حضر» يكون مع الحال «متأخرًا» والمركب الحرفي «إلى المدرسة» المركب 


الفعلي () كما في الشكل (8-5). 


طاحم 


الذزها 
إن 


27 1 


27م 2 
إلى 


متأخرا 


الشّكل 4 -6: تكوين المركب الفعلى «حضر متأخر إلى المدرسة». 


وأخيرًا تتكون الجملة (5) ىا في الشكل (4-4) من تتابع المركب الاسمي «الطالب» 


(812) والمركب الفعلى (97) «حضر متأخرًا إلى المدرسة»). 


17م م 


إلى 281 
ل 


الشّكل 4 -3: الهيكل التركيبي النهائي للجملة في (1). 


-١55- 


وبشكل عام يستخدم اللغويون التمثيل الشجري للتعبير عن الهيكل التركيبي 
للجملة بشكل مفصل. حيث يتم التفريق بين نوعين من الوحدات داخل التمثيل 
الشجري: النوع الأول يسمى بالوحدات النهائية وهي الكلمات في نباية الشجرة 
التحليلية التي لا يمكن تحليلها إلى وحدات أقل على مستوى التركيب مثل (حضر - إلى 
| مدرسة ... إلخ) أما النوع الثاني الوحدات غبر النهائية وتشمل كل الوحدات داخل 
التركيب التي لم يصل فيها التحليل إلى الكلمة المفردة الموجودة داخل المعجم مثل (- 5 
1-8-5 - هلح ه/7آ...... ). 

من الأنظمة الأخرى المتبعة في تمثيل التحليل التركيبي للجمل في اللغات الطبيعية 
استخدام الأقواس للتعبير عن هيكل الجملة. فالجملة في (9) يمكن تمثيلها ىا في 
الشكل :)٠١-5(‏ 


[[الجوم [طالب إوج] مير [حضرس][متأخرا]:1جمم [إلى م[الرورح [مدرسةإير |ميجاممام ىأو 

الشّكل ٠١-4‏ : تمثيل التحليل التركيبي للجملة (1) باستخدام الأقواس 

0 إلا آن اللغويون يفضلون ثيل التركيب النحوي للجمل بشكل غير تفصيلٍ وهو ما 

يعرف باسم التمثيل الجزئي للتركيب النحوي والذي يتم فيه تمثيل الوحدات الرئيسية 

التى تشكل الجملة دون النظر إلى التركيب الداخلى لتلك الوحدات كما في الشكل (84- 

)١‏ والذي استخدم المثلث لتمثيل الوحدات التي تتكون من تركيب معقد والتي لم يتم 

تمثيلهاء وفي الجملة () اتبعت طريقة ١استخدام‏ الأقواس» لكن دون تفاصيل وسوف 

نتناول بشكل مفصل التمثيل الجزئى في الجزء الخاص ب «دقة المحللات». 


جاتير 
طاحا 7ع 
الطالب حضر متأخرا إلى المدرسة 


الشّكل :١١-4‏ التمثيل الجزئي للتركيب النحوي للجملة (1). 


-١858- 


هذه الطبعة إهداء من المركز 
ولا يسمح بنشرها ورقيا أو تداولها تجاريا 
:ا ييا 


[[الطالب]712 [حضر متأخرا إلى المدرسة] 177 5] (8) 


كما ذكرنا من قبل أن القواعد النحوية يجب أن تكون قادرة على توليد وتحليل الجمل 
الصحيحة» وتعيين البنية النحوية المناسبة للجمل ال معنية بالتحليل وكا تبين لنا إنه يمكن 
تمثيل البنية النحوية للجمل عن طريق التمثيل الشجري كم في الشكل (4-5)» فعلينا 
أن نتساءل عن ماهية القواعد التي تستطيع تمثيل البنية النحوية للجمل» وللجواب عن 
هذا بالنظر إلى التمثيل الشجري في الشكل (9-5) يمكن صياغة مجموعة من القواعد 
كا في (9). 
مم لام اج م72 (رن) ما ميحج 5(ا) (5) 

17 281 جدمزخ (د) ملح مج مم(ج) 

فالقاعدة (أ) تفترض إمكانية تكوين الجملة من مركب اسمي (7/5) متبوع بمركب 
فعلي (95). والقاعدة (ب) تفترض أن المركب الفعلي (775) يتكون من فعل (177) 
وحال (/8107) بالإضافة إلى مركب حرفي (05). والقاعدة (ج) تفترض أن المركب 
الحرفي (27) يتكون من حرف (7) متبوع بمركب اسمي (7815). ثم أخيرًا القاعدة (د) 
تفترض أن المركب الاسمي (715) يتكون من أداة تعريف (1281) واسم (8). وقد 
أطلق تشومسكى على تلك القواعد قواعد التركيب العباري ((156ا0ناتا5 عقققطط 
050) 010 وسميت بذلك لأنها تستطيع تحديد كيفية تكوين الجمل من 
مركبات وكيفية تكوين المركبات من كلمات» وهذه الافتراضات تلقي الضوء على 
دور تشومسكي في تطوير علم اللغة الرياضي وتطوير قواعد صورية يمكن من خلاها 
صياغة قواعد النحو في صورة قواعد رياضية. 

وبتطبيق تلك القواعد التي تعتمد على الفئات النحوية (281«تتطةتع 03168011231) 
في (9) وحدها نستطيع الحصول على التمثيل الشجري في الشكل :)١5-5(‏ 


0 


0 
<١ الذزه‎ 


ماح 
7 آم م حير 


1ط م 


الشّكل 4-؟١:‏ التمثيل الشجري للجملة (1) باستخدام القواعد في (8). 
بالإضافة إلى تلك القواعد التى تعتمد على الفئات النحوية والتى استطاعت تكوين 
التمثيل الشجري في الشكل )1١-4(‏ فالمكون النحوي يحتوي أيضًا على معجم به قائمة 
من مفردات اللغة مع معلومات عن فئة تلك المفردات ويمكننا هنا أن نتخيل أن المعجم 
المستخدم لدينا في جملة (1) يحتوي على المفردات المبينة في الشكل (17-5). 


حضر 1 
طالب 2 
مدرسة لم 
متأخرا 1217م 
إلى 1 
ال الدزها 


الشّكل 1-4: معجم به قائمة من مفردات اللغة وفئتها. 
وما علينا الآن إلا إدراج المفردات المتواجدة في المعجم والتي لما فئة محددة تحت 
الفئة التي تندمي إليها داخخل التمثيل الشجري في الشكل )١1-4(‏ والمسئول عن ذلك 


قاعدة تُعرف باسم قاعدة إدراج المفردات وبذلك نتمكن من تمثيل الجملة كما في الشكل 
:)١5-:(‏ 


-١8ةا/-‎ 


هذه الطبعة إهداء من المركز 
ولا يسمح بنشرها ورقيا أو تداولها تجاريا 
:ا ييا 


9 
م سلسلا 
مار من 
بسر مم 
اده 5" م 
ال طالب بي لام م 8م كر 
حضر متأخرا إلى ال مدرسة 


الشّكل :١5-4‏ التمثيل الشجري للجملة (1) باستخدام القواعد في (4) مع إدراج المفردات. 


وفي ختام هذا العرض ننتهي إلى أن المكون النحوي للغة يحتوي على قواعد تعتمد 
على الفئات النحوية قادرة على تمثيل التركيب الداخلي للجمل والمعجم وقاعدة إدراج 
المفردات وتلك المكونات قادرة على توليد التمثيل الشجري في الشكل )١5-5(‏ 
للجملة في (1) وهو نفسه الموجود ني الشكلان (9-5) .)2٠١-5(‏ ومن هنا نود أن 
ننوه إننا قد حققنا الحدف المنشود من بناء تلك القواعد النحوية في (9) والتى استطاعت 
ديد البهة التركبية لللعملة ()كاخر موقيس ف الفكل 05-2 


١‏ ” القدرة التوليدية للقواعد وقياسها 


تتميز اللغات الطبيعية بالقدرة الإبداعية العالية» فالقواعد التي تم بناؤها في (9) سوف 
تكون قادرة على توليد عدد لا مهائى من الجمل وليس فقط الحملة الممثلة في الشكل (1-5) 
فكل) زادت عدد القواعد وأيضا زاد حجم المفردات المدرجة داخل القاموس تزداد عدد الجمل 
التي يمكن توليدها؛ فعلى سبيل المثال إذا تم دخول كلمات - مثل فصل» ولدء صبي؛ ذهب 
- وصدل: لع دايع رجره تنس القر عذال (4) تنك يمك ترليد غلبن الكل (-18). 


الطالب حضر متأخرا إلى المدرسة. 
الصبي حضر متآخرا إلى المدرسة. 
الولد حضر متأخرا إلى الفصل. 

الطالب ذهب متأخرا إلى المدرسة. 
الصبي ذهب متأخرا إلى المدرسة. 
الطالب وصل متأخرا إلى الفصل. 


الولد حضر متأخرا إلى المدرسة. 
الطالب حضر متأخرا إلى الفصل. 
الصبى حضر متأخرا إلى الفصل. 
الولد ذهب متأخرا إلى المدرسة. 
الولد وصل متأخرا إلى الفصل. 
الصبي وصل متأخرا إلى الفصل. 


الشّكل 4 -15: الجمل التى يمكن توليدها من القواعد في (9). 


-١5/8- 


وإذا تم تعديل القواعد ني (9) إلى )١١(‏ بحيث يكون وجود الحال في المركب الفعلي 
المجم الذي امنتطاع توليتالجتمل ف الكل ١5-43‏ فإنه يمكن تؤليد الجمل كا في 


الشكل .)١5-5(‏ 
0م (لاطهم) اج م7ا(ب) ملا ملرج 5() )٠١(‏ 
11 781 ج ملم (د) لا مج مم(ج) 

الطالب حضر متأخرا إلى المدرسة. الولد حضر إلى الفصل. 

الصبي وصل متآخرا إلى المدرسة. الصبي حضر إلى المدرسة. 

الولد ذهب متأخرا إلى الفصل. الطالب حضر إلى المدرسة. 

الصبى حضر متأخرا إلى الفصل. الولد حضر إلى المدرسة. 

الال بحس باكرا ل الفعدل. الطالب حضر إلى الفصل. 

الولد حضر متأخرا إلى المدرسة. الصبي حضر إلى الفصل. 


الشّكل 15-4: الجمل التى يمكن توليدها من القواعد في .)٠١(‏ 

لذا نحن بحاجة إلى اتساع في المعجم واتساع في عدد القواعد التي تعتمد على 
الفئات النحوية لتوليد عدد لا نهائي من جمل اللغة الصحيح:. ولا بد من قياس 
كفاءة القواعد التي تم بناؤها وذلك عن طريق توصيف معايير محددة للتأكد من 
كفاءة القواعد وقدرتها على وصف تراكيب الجمل وصفًا صحيحًا من أجل ماكاة 
أفضل للنموذج اللغوي البشري. فقام تشومس كي بوضع ثلاثة معايير 
أساسية لقياس كفاءة القواعد النحوية لأي لغة وهي: معيار كفاءة 
الرصد (ل11369و406 065619360081)؛ توصف قواعد اللغة بأها قد 
حققت معيار كفاءة الرصد إذا كانت هذه القواعد قادرة على التنبق بصحة أو 
خطأً الجممل نحويًا ودلاليًا وفونولوجيًا وهو أقل المعايير كفاءة. ومعيار كفاءة 
الوصف ((إع4060112 ع كتامتتعوء12)؛ م القواعد معيار كفاءة الوصف إذا 
كانت قادرة على التنبؤ بصحة أو خطاً الجمل نحويًا ودلاليًا وفونولوجيًا (كفاءة 


0 


هذه الطبعة إهداء من المركز 
ولا يسمح بنشرها ورقيا أو تداولها تجاريا 
:ا ييا 


بنية الجمل في اللغة وتقدم وصمًا يعطي تفسيرًا وصفيًا لتراكيب اللغة كم في 
النموذج البشري لابن اللغة. ومعيار كفاءة التفسير (ا40601136 /1328601م18:2) هو 
أعلى معيار يحدد كفاءة القواعد. ويتحقق معيار كفاءة التفسير إذا كانت القواعد قادرة أن 
تحفق درجة كفاءة الوصف بالإضافة إلى شرطين أساسين. الأول: إذا كانت القواعد 
لا تحتوي على أي قاعدة تتنانى مع مبدأ كتابة القواعد في أي لغة من اللغات أي أن 
القواعد تستطيع وصف جمل اللغة في ظل وجود مجموعة من الشروط 
المحددة والمتفق عليهاعالميافي كتابة القواعد. 

فعلى سبيل المثال فإنه من غير المتوقع أن تحتوي أي لغة على قاعدة نحوية تنص على 
أنه يمكن أن تحلل الجملة إلى مركب اسمى ومركب فعلى في السادسة مساءً؛ فتلك 
الفاعدة لذ يكن أن سوتعوى أ لغة من اللقات الظيسية وؤلاف لألر) يد عن 
معلومات غير لغوية (الزمن) وذلك منافٍ لشروط بناء القواعد في أي لغة من اللغات 
(واقدمط2 .)١15‏ أما الشرط الثاني فهو أن تحاكي القواعد الطبيعة النفسية الواقعية 


والقدرة الذهنية للنموذج البشري للغة. 
؟, "- هل تبنى قواعد التركيب على فكرة وجود المركبات والفئات النحوية 
أم على فكرة وجود الكلمات؟ 


تتسم القواعد التي تعتمد على الفئات النحوية بقدرتها على تحقيق مبدأ التعميم. 
فمنظومة النحو تهتم ببناء نظام قادر على تحديد توزيع وترتيب الكلمات داخل تركيب 
الجمل. فأي محاولة لبناء نظام لا يعتمد على الفئات النحوية لن يكون قادرًا على بناء 
قواعد لتكوين المركبات وتوزيعها داخل الجمل واستخدام هذه القواعد لتوليد عدد 
لا نمائي من الجمل. فإذا رفضنا فكرة القواعد المبنية على المركبات التي تعتمد على 
الفئات النحوية» فلن يكون هناك وسيلة لبناء قواعد لتحليل وتوليد مجموعة الجمل 
مثل تلك الموجودة في )١١(‏ إلا باستخدام قواعد تبنى على الكلمة » وهذا ما يعرف ب 


(81لتصطتة 0 01121ع2168عم7210) أو (تقصتصطة 0 لعقوط-11010) . 


و ه6١1-‏ 


وفي هذه الحالة يتم توليد الجمل في )١١(‏ عن طريق عمل مصفوفة تضم مكان لكل 
كلمة من كلمات الجملة وتوضع كل كلمة في عمود كى| نرى في الشكل :)١7-5(‏ 
١ 1 0 3 3 1 ١‏ م |41 1١ 1١١ ٠‏ 


طالب ليه |اوضت: ١|‏ مديو ‏ افاضيل طالب ناجح 
ذكى 1 حي ١‏ لاض 
فاضل ذكى 0 


الشّكل 17-4: مصفوفة تضم مكان لكل كلمة من كلمات الجملة. 

وعندها يكون بناء مجموعة من القواعد لتوليد أي جملة عن طريق اختيار كلمة من 
عمود رقم )١(‏ ثم من عمود رقم (5) ثم من عمود (7) ...... وهكذا. وهذا الاتجاه 
في بناء القواعد يؤدي إلى مشكلات منهجية عدة منها: (( التخلٍ عن مبدأ التعميم في 
القواعد؛ فلا بد من ذكر كل كلمة بعينها بدلا من ذكر فئتها. (ب) نجد تكرارا واضحا 
بين الكلمات وارتباطها بمكان توزيعها؛ فمجموعة الكلمات في العمود رقم (؟) هي 
نفسها الكلمات في العمود رقم (5) ورقم .23١(‏ (ج) لا يمكن هذه المنهجية التعامل 
مع ظاهرة التكرار في بناء المركبات داخل الجملة؛ يمكن للجملة أن يزداد طوها إلى ما 
لا نهاية بسبب العطف مثلا كما في :)١7(‏ 


رآأيت محمد وعلي وأحمد وخالد وطارق وعمر. فده 


-1١601١ 


هذه الطبعة إهداء من المركز 
ولا يسمح بنشرها ورقيا أو تداولها تجاريا 
:ا ييا 


فإن أي محاولة لبناء قواعد لا تعتمد على الفئات النحوية لوصف ظاهرة التكرار 
في اللغة بشكلها المطلق ستكون مستحيلة. وإلا سنضطر إلى بناء مصفوفة من أعمدة 
لا نبائية من الكلمات كلما تكرر العطف. فيستحيل على هذا النوع من القواعد تفسير 
القدرة التوليدية اللا نبائية للجمل. وسيؤدي ذلك بدوره إلى خرق المبدأ الرئيسي لبناء 
القواعد الذي لا بد فيه أن تتوافر إمكانية بناء عدد محدود من القواعد قادرة على توليد 
عدد لا نبائي من الجمل» ولكن في هذه الحالة ستكون عدد القواعد لا نهائية مع زيادة 
عدد الأعمدة في المصفوفة الذي يعتبر أمرا غير مقبول كمبدأً بناء للقواعد اللغوية. 

ولكن إذا ما اعتمدنا في نظام القواعد على الفئات النحوية فنجد أن جميع المشكلات 
السابقة لن يكو ن لما وجود. فظاهرة التكرار يمكن التعامل معها بسهولة في نظام القواعد 
التى تعتمد على الفئات النحوية وتفسير إمكانية توليد عدد لا نهائى من الكلمات طبقا 
للقواعد الموصفة. ومن نقاط القوة أيضًا التي ترجح كفة نظام القواعد التي تعتمد على 
الفئات النحوية أن هذه القواعد تمثل نظامًا أكثر إحكامًا وتقييدًا من نظام القواعد التي 
لا تعتمد على الفئات النحوية. فنظام القواعد التي تعتمد على الفئات النحوية يفترض 
وجود قيود تحدد القدرة التوليدية للقواعد شرط أن تكون مكونة من عدد محدد من 
الفئات العبارية (0316801165) 3531قط2) والفئات المعجمية (0216801165) 1.651631) 
وهي (4101/5 ,41017 ,7/8 ,1 ,2/2 ,21 ...) ولا يمكن الخروج عن هذه الفئات المزيد 
من المعلومات يمكن الاطلاع على (1988 ,1301010)). 

إِذَا نستنتج مما سبق أن نظام القواعد التي تعتمد على الفئات النحوية هو الأكثر 
تعبيرًا عن طبيعة بناء القواعد وذلك لثلاثة أسباب: أولا قدرته على التعميم وثانيًا 
قدرته على التعامل مع القدرة التوليدية اللا نبائية للجمل وأخيرًا طبيعته الأكثر إحكامًا 
وتقييدًا. فلا بد لأي عمل يسعى إلى بناء قواعد نحوية قادرة على توليد وتحليل الجمل 
العربية أن تستمر في هذه المهمة لنصل إلى قواعد نحوية عالية القدرة الإنتاجية في توليد 
وتحليل عدد لا نبائي من الجمل. 


-1١61 


” و #- البنية السطحية والبنية العميقة للحملة 
إن قواعد النحو لا بد أن تكون قادرة على توليد كل البنى السطحية للجمل في اللغة 
وهذا يتحقق عن طريق مجموعة من القواعد التي تعتمد على الفئات النحوية والمعجم 
وقاعدة إدراج المفردات. ولكن تلك المكونات وحدها لم يكن لديها القدرة على التعامل 
مع أنواع أخرى من التراكيب تظهر في اللغات الطبيعية؛ فعلى سبيل المثال الحملة المبنية 
للمجهول في (17): 
الأقلام وَضعت في الحقيبة )2 
فإن القواعد التي تعتمد على فئّة المفردة التي تم بناؤها سوف تتنبأ خطًا أن الجملة 
ف (1) غير صحيحة,. وذلك لأنها تنتهك الإطار النحوي (511521]6801153600 
عمنة؟)() المبني للفعل الوضع)؛ فالفعل «وضع» يحتاج إلى متعلقات نحوية لإتمام 
تركيب الجملة بشكل صحيح. كقولنا «الرجل وضع الأقلام في الحقيبة» فيأتي ورائه 
مركب اسمي ومركب حرفي ولكن في الجملة (11) نجد أن الفعل (وضع) يأ ورائه 
مركب حرفي فقط ولا يأتٍ ورائه مركب اسمي. 
ولكن الجملة في )١177(‏ هي جملة صحيحة ولكن حدث فيها تحريك للعبارة الاسمية 
(الأقلام)اعوطريق فعلة ب ف ايساية خريك الكت لاسو يك إنة بهم ريات 
المركب الاسمى من مكانه الأصلى (بعد الفعل) في البنية العميقة للجملة كىا في )١5(‏ 
وهنا يجب أن تقرق بن الينية الجميقة للتجملة وه الشكل الناطى وي الظاهر التجايلة 
والبئية السطحية وهي على عكس البنية العميقة. 1 
وضع الأقلام في الحقيبة. 0050 


في )١15(‏ استخدام لب يعبر عن موضع الفاعل ونجد أن الفعل (وضع) يقع 
داخل المركب الفعلي متبوعا بالمركب الاسمي (الأقلام) متبوعا بالمركب الحرفي (في 
الحقيبة)» ومن هنا يمكن لنا أن نستنتج أن الجملة في (17) نشئت من البنية الأساس 
(©835) في )١5(‏ التي تم توليدها خلال المكون النحوي المبني على أساس القواعد 
والمعجم وقاعدة إدراج المفردات فقط. 


6ت 


هذه الطبعة إهداء من المركز 
ولا يسمح بنشرها ورقيا أو تداولها تجاريا 
:ا ييا 


وبناء القواعد ببذه الطريقة يعاني من مشكلات أخرى. فعلى سبيل المثال سوف 
يتمكن المكون النحوي من توليد الجملة في )١5(‏ ولكنه لا يتمكن من توليد الجملة في 
(5). 
الرجل أكل التفاحة. (16) 
التفاحة أكلها الرجل. 0050 
وذلك لأن تلك القواعد تستطيع أن تقدم الوصف الذي يظهر فيه المتعلقات النحوية 
لكل مسند في أماكنها المناسبة. ومن هنا كان لا بد من نشأة نوع آخر من القواعد هي 
ينقل المركب الاسمي إلى موقع الابتداء وهذا التحويل يتناول نقل الركن الاسمي الذي 
يقع على يسار الفعل إلى موقع الابتداء تاركا مكانه عائدا يعود عليه في الموقع الذي كان 
يشغله (زكرياء .)١1917‏ ولذلك لا بد من إعادة تنظيم النحو التحليلٍ لإدراج مكون 
تحويل كا في الشكل :)١18-54(‏ 
)١(‏ قواعد تكوين الجملة على أساس الفئة (5115 0216501381) 
الأساس (8286) © (؟) المعجم (1.671001) 


*) قاعدة لإدراج المفردات (1116 م تاتعقصا 1هع0زع.آ1) 
البنية العميقة (5111111]1 مع126) 
المكون التحويلي: (؟) قواعد التحويل (1116!آ 01032610821 /قصة1) 


البنية السطحية (511011]6 عع3 1ن ) 


الشّكل 1-4 : منظومة النحو التحليلٍ بناء على وجود مكون تحويلي. 
وهكذا يمكن لقواعد النحو في وضعها الحالي أن تكون قادرة على توليد جمل من 
اللغة وهذا يتحقق عن طريق مجموعة من القواعد والمعجم وقاعدة لإدراج المفردات 


لكك 


وأخيرا قواعد التحويل. وعلينا أن نستمر في تحسين قدرة النحو من أجل الوصول إلى 
قواعد على درجة عالية من الكفاءة قادرة عل التعامل مع جميع تراكيب اللغة. 

5 و ”7- المركبات الوسيطة 

إذا نظرنا إلى التتابع «كتاب زيد الجديد» في الشجرة النحوية في الشكل )١9-5(‏ 
سنجد أنه ينقسم إلى ثلاث وحدات (/7) و(8/2) و(42). 
ماحل 


مم طلم )1 


"د حا 0 


الجديد زيد كتاب 


الشّكل :١19-4‏ الشجرة النحوية لجملة «كتاب زيد الجديد)». 

ففي هذا التمثيل التركيبي يمكن لنا القول بأن المركب الوصفي «الجديد» في الشكل 
)١11-5(‏ يصف الاسم «كتاب» حيث يخرج فرع المركب الوصفي والاسم «كتاب» من 
نفس النقطة. ولعل ذلك ليس بالدقة الكافية» لأن المركب الوصفى «الجديد» يصف 
(كتاب زيد) وليس «كتاب» فقطء كما أن «كتاب زيد» يمثل وحدة أيضا بدليل صحة 
العطف عليه بمركب من نفس النوع كما في «كتاب زيد وقلم عمرو جديدان»» ىا يصح 
معه الإسناد ى) في «هذا كتاب زيد)؛ وذلك لا يظهر في الشكل .)١9-5(‏ ولذلك لا بد 
من تعديل التمثيل التركيبي ل الشكل )١9-5(‏ إلى التمثيل الموضح في الشكل :)3١-5(‏ 


مال 
ل م سس 
مم 5 
١‏ سر 
اليد 2 7 
زيد ١‏ كتاب 


الشّكل ١-4‏ 7: التمثيل التركيبي المعدل ل الشكل (ه-19). 


-١608ه-‎ 


هذه الطبعة إهداء من المركز 
ولا يسمح بنشرها ورقيا أو تداولها تجاريا 
:ا ييا 


فنجد أن في الشكل )3١-5(‏ المركب الوصفي «الجديد» يصف المركب الجديد (غير 
المسمى» «كتاب زيد». وكا ذكرنا أن هذا الرس يول وس ستيه فلجلنا ادل 
عن فئة هذا المركب «؟؟» والتي تضم التتابع (215 - [7) ولعلنا في الوهلة الأولى نظن 
أنه مركب اسمي (78) لأن الرأس اسم «كتاب» (21). ولكن لا يمكن أن يكون 
هذا منطقيا إذ إن هذا يعتبر نقصًا في التوصيف النحوي لأن المركب الاسمي الأعلى 
لن يكون له رأس. ومن هنا يمكن استنتاج أن هذه العبارة تمثل مركب وسيطء هذا 
المركب أكبر من الاسم (7) وأصغر من المركب الاسمي (7812). وهنا نجد فجوة 
كبيرة داخل نظام قواعد التركيب العباري (250©) للتعبير عن هذا المركب فلا توجد 
فئات وسيطة ما بين الفئات المعجمية والفئات العبارية في إطار عمل تلك النظرية في 
الوصف التركيبي للجملة ما يؤدي إلى عدم قدرة أي نحو توليدي من الوصول إلى 
مستوى «كفاءة الوصف» حيث أنه لن يكون قادرا على وصف هذا النوع من التراكيب 
في «كتاب زيد الجديد». فظهر مفهوم نظرية 81-]2؛ ووّضعت هذه النظرية عام ١91١‏ 
بواسطة نعوم تشومسكي لتعالج النقص الموجود في التوصيف النحوي في 250 وتم 
تطويرها فيما بعد بواسطة راي جاكندوف عام /ا191. وتنص هذه النظرية على أن كل 
اللغات الطبيعية البشرية تتبادل تراكيب متشابهة محددة لها نفس البنية العميقة والتي 
يمكن قثيلها في الشكل .)7١-5(‏ 


الشّكل ١-4‏ :: تمثيل البنية العميقة باستخدام نظرية 5ه-كا. 
حيث يُستخدم الحرف (30) في هذه النظرية لكي يعرف الفئات المعجمية الأساسية» أو 
رؤوس العبارات؛ فهناك أنواع من رؤوس العبارات وهي (71) للأسماء مثل الضمائر 
الشخصية وأسماء الإشارة .... إلخ و(97) للآفعال و(1) للصفات و(48) للظروف 
و(2) لحروف الجر و(1) للمحددات كالأدوات على سبيل المثال و(©) لحروف 
العطف. وتحدد رؤوس العبارات نوع أو فئة العبارات فنجد أن 71 تنتج مركب اسمي 


-1١605- 


((7 .2/1 تنتج مركب فعلي (1717) ول تنتج مركب وصفي ((ع5قغاظ عكلاءه[40 
[)) ولك تنتج مركب ظرفي ((82) 1256ا 40561) و2 تنتج مركب حرفي (22) 
و[ تنتج عبارة تحديدية ((102)عم0قط2 تاعمتصمعاء2آ) و0 تنتج مركب تكميل 
((56)02تتاط 1261 تاع تع 1م دده 0). وفي شكل )3١-5(‏ الرمزين 362 و28 يسميان 
إسقاطين (601005ز5:0). والرمز 72 يسمى رأس العبارة» ويسمى أيضًا بالإسقاط 
الصفري (دمناءوزه:ط 260) حيث أنه الوحدة النهائية ولا يمكن إسقاط أي 
وحدات نحوية منه وعلى هذا فإن كل عبارة لها إسقاط صفري واحد أي رأس واحدة. 
والوحدة العليا المسماة ب 272 تسمى بالإسقاط الأقصى (00اءءزمع2 21سنعجة3/1) 
حيث أنه أكبر وحدة نحوية يمكن أن يدرج تحتها أي عدد من الإسقاطات. فكل 
الإسقاطات الواقعة بين الرأس والإسقاط الأقصى تسمى بالإسقاطات الوسيطة 
ويمكن وصف الإسقاطات الوسيطة بالوحدات غير النهائية وذلك لإمكانية 
إسقاط وحدات نحوية منها؛ حيث أن الإسقاط الأقصى27< يسيطر على الإسقاط 
الوسيط 78 الذي يسيطر على الإسقاط الصفري 22. أما «561أءءم5) «0هم9) أو 
«المخصص النحوي» وهي الكلمة أو العبارة أو الجملة التى تحدد العنصر «]23 أما 
( أمعممع ا ممه ) ) لوا «المكمل» وهو العنصر النحوي اللازم لإكىال سلامة 
التركيب ٠‏ أما «اعصناز4) «30[6) أو «الملحق» فهي الكلمة أو العبارة أو الجملة التي 
تصف العنصر «228» ولكن ليس من الضروري وجوده نحويا. ويمكنا رؤية التمثيل 
النحوي لأشكال المركبات المختلفة في الشكل (5 -77). 


كتاب 


الشّكل 75-4؟: التمثيل النحوي لأشكال المركبات باستخدام نظرية ها-لا. 
وبعد أن تعرفنا على فكرة وجود المركب الوسيط من خلال نظرية 581 26 يمكننا 
إعادة تمثيل في الشكل )3١-5(‏ إلى الشكل (77-5): 


-١6ما/-‎ 


هذه الطبعة إهداء من المركز 
ولا يسمح بنشرها ورقيا أو تداولها تجاريا 
:ا | ييا 


عكةواط اوتطرع لم عهور]م عرناعع زلم عووراط اوطارعلا عكوواط وناهل! 


: ا عع تناتةة 28 د +22نا رةه 28 
: ا 2 


الشّكل 4 -7: تعديل التمثيل التركيبي للشكل )7١-0(‏ باستخدام المركب الوسيط. 
لمزيد من ترسيخ مفهوم المركبات الوسيطة يمكننا أخذ مثال آخر فإذا نظرنا إلى الجملة 


«الرجل ذهب إلى البيت بسرعة»» نجد أن تمثيل الجملة على النحو الموضح في الشكل 
(755-5) لا يعبر عن حقيقة أن المركب (بسرعة) يصف الحدث (ذهب إلى البيت). 


5 
يي يويجك تيبو يور .. 
ميج مس 
يي بر 
7 لمر 1 مم طاطم 
لول اق ار 
إلى البيت بسرعة 


الشّكل 4-4 7: التمثيل الشجري لجملة «الرجل ذهب إلى البيت بسرعة» 
باستخدام قواعد التركيب العباري (50©). 
وهنا لا بد أن نجمع بين الفعل (ذهب) والمركب ال حرفي (إلى البيت) اللذان يعبران 
معا عن وحدة واحدة - حيث أن المركب (إلى البيت) هو المكمل للفعل (ذهب) - 
لذلك يأتي دور المركبات الوسيطة للتعبير عن ذلك كما في الشكل (55-5): 


-١6/- 


ل 
مير مين 
سم ١‏ 
287 كر 178 

1 
ال رجل 278 ملام 
7 صم 

الحهة سنن 

ذهب 9 إلى البيت 


الشّكل 4 -70: ربط الفعل (ذهب) والمركب الحرفي (إلى البيت) في وحدة واحدة (01718. 

حيث نجد أن المركب الفعلي يتكون من إسقاط وسيط والذي يتكون بدوره من 
إسقاط وسيط آخر (يتكون من الفعل والمركب الحرني) ومركب ظرفي. أي أن المركب 
الظرفي أصبح يصف المركب (ذهب إلى البيت). 

وبذلك يمكننا القول بأن قواعد النحو أصبحت الآن على درجة أعلى من الكفاءة 
ويمكنها الوصول إلى مستوى كفاءة الوصف؛ حيث تستطيع تمثيل مستوى أعم من 
تراكيب اللغة المختلفة وعلى ذلك فإنه ينبغي الاستمرار في تحسين قدرتمها أكثر فأكثر 
حتى تصل إلى درجة عالية من الكفاءة تمكنها من التعامل مع التراكيب اللغوية بشكل 
كامل. 

ه. ”"-الفصل بين التركيب والدلالة 

قبل طرح قضية الفصل بين التركيب والدلالة لا بد أن نشير إلى ظاهرة لغوية تتميز 
بها اللغات الطبيعية وهي الالتباس التركيبي؛ ويقصد هنا باللبس التركيبي أن يكون 
هناك أكثر من تحليل للجملة بعد تطبيق قواعد التحليلء فعلى سبيل المثال الجملة في 
(10). 

عقد مؤتمر للسلام في الشرق الأوسط. 210١‏ 

فإذا نظرنا إلى القواعد التي سوف يتم تطبيقها للحصول على البنية التركيبية للجملة 

في (117) فنجد أن تطبيق القواعد في (16) يصل بنا إلى تمثيل الجملة خلال شجرتين. 


-506004 


هذه الطبعة إهداء من المركز 
ولا يسمح بنشرها ورقيا أو تداولها تجاريا 
رب اا لط ط ييا 


مم ضح م جومم () 
مم 11 2م12 (ب) 
م1 مععم <2-مم(زت) 

11 )ع «طلؤزرث) (8) 
«[مطث 2 2 ع2 2م[ (ج) 
زلنى ع2 1152م (ح) 
ملح 11 2م[ (خ) 


فعند تطبيق القواعد في )١1(‏ لتحليل الحملة في )١77(‏ فإنه يمكن الحصول على البنية 
الموضحة في الشجرة في الشكل (55-5). 


ملح 


الشّكل ه-5:: التحليل الشجري للجملة (17). 

حيث يتركب المركب الاسمي «١عقد‏ مؤتمر للسلام في الشرق الأوسط» من اسم (/2) 
(عقد) ومركب اسمى (718) آخر «مؤتمر للسلام) ومركب حرفي (22) «في الشرق 
الأوسط» كا.ق (1-أ) ويتكون المركب الاسمى «مؤتمر لا ملام) من اسم ١عقد)‏ 
ومركب حرفي اللسلام» ىا في (١-ب)‏ ويتكون المركب الحرني اللسلام» من حرف 
«ل» ومركب اسمي «السلام» كما في (4١-ت)‏ ويتكون ذلك المركب الاسمي من أداة 
تعريف «ال) واسم (سلام» كما في (1١-ث).‏ أما المركب الحرفي «في الشرق الأوسط» 
الممثل داخل المربع في الشكل (55-5) فهو يتكون من حرف «في» ومركب اسمي 


عات 


«الشرق الأوسط» وذلك من خلال القاعدة (/١-ت)‏ والمركب الاسمى «الشرق 
الأوسط» يتكون من أداة تعريف «ال» واسم «#شرق» ومركب وصفي وللف من خلال 
القاعدة في (/١-ج)‏ وأخيرا يتكون هذا المركب الوصفي من أداة تعريف «ال» وصفة 
«أوسط) من خلال القاعدة في (/١-ح).‏ 

ولكن إذا نظرنا إلى القواعد في )١1(‏ فإننا نجد إنه يمكن تطبيق القواعد بشكل 
آخر وعند ذلك يمكننا الحصول على تمثيل مختلف للبنية النحوية للجملة في )١17(‏ 
وهوالموضح في الشكل (71-4) والذي يختلف عن التمثيل في الشكل (55-5). 


الشّكل ه-707: تحليل شجري آخر للجملة (17). 


حيث يتركب المركب الاسمي «عقد مؤتمر للسلام في الشرق الأوسط» من اسم 
(00) «عقد» ومركب اسمي (2812) آخر «مؤتمر للسلام في الشرق الأوسط» خلال 
القاعدة (/١-خ).‏ 

فإذا نظرنا إلى الشكل (55-5) نجد أن المركب الحرفي «في الشرق الأوسط») وصف 
على أنه يرتبط ب «عقد المؤتمر»» أي أن عقد المؤتمر تم في الشرق الأوسطء وتم تمثيل 
ذلك في الشجرة النحوية عن طريق إضافة فرع من المركب الاسمي» وذلك على خلاف 
ما نجده في الشكل (5-/77)؛ حيث نجد أن الجملة تم تحليلها على أساس أن المركب 
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هذه الطبعة إهداء من المركز 
ولا يسمح بنشرها ورقيا أو تداولها تجاريا 
:ا ييا 


الحرني «في الشرق الأوسط» يرتبط بالمركب الاسمي «السلام»» أي أن «السلام» تم 
تحديده بأنه في الشرق الأوسط. وتم التعبير عن ذلك في توصيف الشجرة النحوية حيث 
أن المركب الحرفي متصل بفرع من المركب الاسمي «السلام». وهنا نجد أن اختلاف 
التركيب النحوي كما في الشكلين (55-0), (77-5) أدى إلى اختلاف في المعنى 
وتفسير الغموض في الجملة في (117) وعلينا أن ننوه أن ما حدث من تفسير للغموض 
الذي هو ظاهرة دلالية لا يعد تداخل بين التركيب والدلالة لأن التداخل معناه 
استخدام مفاهيم من مستوى آخر (الدلالة) لوصف تركيب الجملة فا حدث هنا يدل 
على أن النحو بشكل طبيعي يمكنه أن يفسر المعنى دون استخدام مفاهيم من الدلالة» 
وتعد تلك القدرة حسب ما وصفه تشومسكى أحد المميزات التى تضاف إلى قدرة 
القواعد التحوية التي لديها القدوة غل تكوين بنى تحوية تفسر معاني اللجمل الطبيعية, 

ويتفق هذا مع إشكالية ما أسماه تشومسكي باستقلالية النحو (01 '(11000172اللم 
59/11]8)» حيث يرى تشومسكي «أن التركيب مستقل عن الدلالة» ولا علاقة له بها») 
(سيرلء 214174)» وإنا يتم النظر إلى منظومة النحو دون الرجوع إلى المعنى أو السياق. 
ولعلنا هنا قد لفتنا النظر إلى علاقة التأثير ما بين منظومة النحو والدلالة. فوجود تفاعل 
بين المنظومتين لا يعني الدمج بينهم|. ولمزيد من التفاصيل عن قضايا اللبس التركيبي 
يمكنك الاطلاع على (2004 برطاعتة؟181-1 عت ,لإتتقحصث-1ظ). 


5 - مدخل إلى معالجة تركيب الجملة آليا 

بعد أن تعرفنا في الأجزاء السابقة على كيفية تكوين البنية التركيبية للجمل وكيفية 
بناء قواعد تسمح بتحديد البنية التركيبية للجمل» فنكون بذلك قد ألقينا الضوء على 
بعض المفاهيم الأساسية عند تناول التحليل النحوي للجمل؛ فالتحليل النحوي يعد 
من المتطلبات الحهامة والمحورية في العديد من تطبيقات معالحة اللغات الطبيعية كالترجمة 
وأنظمة الإجابة على الأسئلة وتطبيقات نظم الحوار» فمثل هذه التطبيقات تتطلب 
معرفة معان جمل اللغة الطبيعية. ولإتقان معاني الجمل لا بد من توفر التركيب النحوي 
للمكونات الجوهرية للجملة. وال هدف الأسامى من التحليل النحوي هو تحديد 
التراكيب النحوية الت تعب عن مدى التطابق بي جل اللغة الطبيعية ومغانيها (,1,11/060 
6). فالأبحاث التي تتضمن العلاقة بين الجملة ومعناها تعد من الأبحاث الصعبة 
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والضرورية لفهم اللغة الطبيعية. فم| علينا الآن إلا بناء نظام يمكن أن يقوم بتنفيذ مهمة 
تكوين البنية التركيبية للجمل آلياء وهو ما يعرف باسم المحلل النحوي حيث إن إتاحة 
المحللات النحوية الآلية هى نقطة انطلاق للمعالجة الذكية للغات الطبيعية. 


١‏ 4- تصميم منطق بناء المحللات النحوية 

تتعدد الا تجاهات والتقنيات المتبعة عند بناء المحللات النحوية فيتم بنائها بالاعتماد 
على اتجاهين للتحليل النحوي؛ التحليل النحوي من أعلى إلى أسفل والتحليل النحوي 
من أسفل إلى أعلى ويمكن من خلال هذين الاتجاهين الوصول إلى نفس التركيب 
النحوي للجملة على الرغم من الاختلاف في طريقة تطبيق وترتيب القواعد ني كلا 
الاتجاهين. وعلى المحلل النحوي أن يحدد ما إذا كان الاتجاه المتبنى للتحليل غير محدد 
أو محدد (1997 ,0:01 22 ,ةطصتة)ة1 ,لإكا15ه1205:07). وفيم| يل سوف نتناول 
عرض كل اتجاه بالتفصيل ويلٍ ذلك توضيح لفكرة التحديد وعدم التحديد في الاتجاه 
المتبنى أثناء التحليل النحوي. 

* التحليل النحوي من أعلى إلى أسفل 

التحليل النحوي من أعلى إلى أسفل هو أحد طرق بناء المحللات النحوية ويتم فيه 
بناء الشجرة النحوية من خلال النظر إلى الجملة (أعلى مستوى) وتجزئتها عن طريق 
القواعد النحوية» يتم خلال هذا النوع من التحليل التعرف على العلاقات بين أجزاء 
لمكي 

وفي هذا الاتجاه يبدأ المحلل النحوي بتطبيق القواعد لبناء شجرة للجملة المدخلة 
بدءً من الوحدات غير النهائية وانتهاءً بالوحدات النهائية؛ أي مفردات الجملة» ومرورًا 
بعدد من القواعد والقيود التي تعمل على اختيار الكلمة المناسبة وتسكينها في المكان 
الملائم للها في هيكل الشجرة النحوية وفًا لفئة الكلمة. فعلى سبيل المثال إذا أدخلنا جملة 
«الرجل ذهب إلى البيت» فيتم تطبيق عدد من القواعد كى| هو في )١9(‏ لبناء الشجرة 
النحوية في الشكل (18-5) لهذه الجملة وسوف نقوم بعرض تلك القواعد بالتفصيل: 


- 


هذه الطبعة إهداء من المركز 
ولا يسمح بنشرها ورقيا أو تداولها تجاريا 
:ا ييا 
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ال رجل ذهب إلى ال البيت 


0) 
5 

7 طلزارب) 
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١|‏ أع0آ معط ممع 8 اع7آ رج) 
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171 24 مع ذهب رجل ال(د) 
7 إلى ذهب رجل ال(ذ) 

27 ال إلى ذهب رجل ال (ر) 

بيت ال إلى ذهب رجل ال (ز) 


الشكل 58-5 : بناء الشجرة النحوية لجملة «الرجل ذهب إلى البيت» من أعلى إلى أسفل. 

عند دخول الجملة - ويشار لها ب 58 - إلى المحلل» فإن المحلل يستوعب ذلك عن 
طريق القاعدة في ١9(‏ -أ) وبعد ذلك يتم تحديد أن هذه الجملة تتكون من مركب اسمي 
وآخر فعلي ا في (9 ١‏ -ب»» وأن المركب الاسمي الذي تم الحصول عليه خلال -١9(‏ 
ب) يتكون من أداة تعريف واسم كى) هو مبين في (94١-ت)‏ وكذلك المركب الفعلي في 
(19-ب) يتكون من فعل ومركب حرفي كما في (9١-ث)‏ وأن المركب الحرني يتكون 
من حرف ومركب اسمي كما هو مبين في (4١-ج)‏ وهذا المركب الاسمي في (9١-ج)‏ 
يتكون من أداة تعريف واسم كا في (94١-ح)؛‏ وعند هذه المرحلة يكون قد تم الوصول 
إلى العلاقة البنائية لأجزاء الجملة؛ وتم أيضا تحديد الفئة النحوية لكل جزء في الجملة. 
أما في القواعد (؟9 تحخى (19-د). (19-ذى (19 حر (19-ز)ء (19-دس) فيتم 
فيه تسكين كل مفردة من مفردات الجملة في المكان المناسب لما داخل الشجرة النحوية 


التي تم بناء فروعها. 
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. التحليل النحوي من أسفل إلى أعلى 
هذا التحليل هو المقابل للتحليل السابق؛ حيث يقوم المحلل النحوي بتقسيم الجملة 
المدخلة إلى مفردات ووحدات أصغر هى نقطة الانطلاق في التحليل؛ ففي هذا الاتجاه 
يبدأ المحلل النحوي بتطبيق القواعد لبناء شجرة للجملة المدخلة بدءًا من الوحدات 
النهائية وانتهاءً بالوحدات غير النهائية. فيتم تقسيم الجملة إلى كلمات وكل كلمة يتم 
وسمها بالفئة النحوية التي تنتمي إليها ويتم استخدام هذه الفئات لبناء علاقات تركيبية 
بين الكلمات بعضها البعض لتكوين مركبات أكبر» يتم الربط بين هذه المركبات لبناء 
الشجرة التحليلية الكاملة للجملة. فعلى سبيل المثال إذا أدخلنا جملة «الرجل ذهب إلى 
البيت)؛ فإن المحلل يقوم أولاً بالتعرف على المفردات المكونة للجملة من واقع المعجم 
وهى «ال» - «رجل) - «ذهب) - (إلى) - «ال) - «بيت» وهى على الترتيب أداة تعريف». 
اسم» فعل» حرفء أداة تعريف. اسم. ويمكن توصيف مراحل التحليل بشكل مبسط 
عن طريق عدد من القواعد الموصفة في )7١(‏ لاستخراج الشجرة في الشكل (591-5): 
)0 
بيت ال إلى ذهب رجل ال (أ) 
بيت ال إلى ذهب رجل 1066 (ب) 


ذل بيت ال إلى ذهب 10663 (ت) 

مار 7ع ا 1 

7010 ب بيت ال إلى :ه517 1066121 (ث) 
أ 28 70 مم ع 

0 بيت ال مع طرع1 2 ]ع1 (ج) 

م6 11 بيت ]ع0[ معط ط7ء7 اع[ (ح) 

ع2 8م 1 ]ع1 معط م7 لم عن[ (خ) 

00000" اك “اليك 1 غءنا معط طمء7ا طلم (دم) 


0لا معط طنع7ا هلح (ذ) 
0م ليع طلخ (ر) 
7ع طلا (ز) 
5 (س) 
الشكل 5 -4:: بناء الشجرة النحوية لجملة «الرجل ذهب لى البيت» من أسفل إلى أعلى. 
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هذه الطبعة إهداء من المركز 
ولا يسمح بنشرها ورقيا أو تداولها تجاريا 
:ا ييا 


ففي القاعدة (١7-أ)‏ يتم التعرف على المفردات المكونة للجملة وبعد ذلك يتم 
وسم تلك المفردات كما في القواعد رقم (٠١-ب).‏ (١7'-دت)‏ (١7١-ث) 7١(‏ حنج 
(٠-ح):(١7-خ)‏ بعد ذلك يبدأ المحلل في تكوين مركبات أكبر ففي القاعدة -١٠(‏ 
د) و(١7-ذ)‏ يتم تكوين مركب اسمي من خلال الدمج بين أداة التعريف والاسم 
الذي تم الحصول عليهم في (١٠٠-خ).‏ وكذلك من خلال (١7-ر)‏ يتم تكوين المركب 
الحرفي عن طريق الجمع بين حرف الجر والمركب الاسمي الذي يليه والذي قد تم 
الحصول عليهم من خلال القاعدة (٠7-ذ).‏ وبعد ذلك يتم الدمج بين المركب الحرفي 
والفعل اللذين قد تم الحصول عليهم خلال القاعدة (١7-ر)‏ ليتكون مركب فعلي ى| 
هو موضح في القاعدة (١7-ز)‏ لتصبح الجملة (5) في النهاية تتكون من مركب اسمي 
وآخر فعلي. 

وبعد اختيار المحلل النحوي لأحد الاتجاهين السابقين» فإن المحلل النحوي عليه 
أن يحدد ما إذا كان الاتجاه المتبنى للتحليل غير محدد (55108ة2 عتاستستصسعاع0م210) 
أو عدد (2015128 516 1متحتتزءاء10)؛ حيث تظهر الحاجة إلى التحليل غير المحدد عند 
ظهور جمل تحتمل أكثر من تحليل» حيث إن القواعد تكون قادرة على أن تسلك أكثر من 
اتجاه. فهذه الطريقة من التحليل تسمح بإنتاج جميع التراكيب الممكنة في حالة الجمل 
التى يحدث فيها لبس لغويء وذلك لتحديد التحليل الأفضل للسياق. ففى هذه الحالة 
يذ السلا اعفار افده معةامرن مره القواعد المحتملة لتركيب الجملة تاركا 
إشارة تمكنه من معرفة أن في هذا الموضع كان هناك قاعدة أخرى محتملة وبعد ذلك 
يبدأ مساره في التحليل مع القاعدة المختارة ويستمر في تطبيق القواعد قيد التطبيق 
التي تمكنه من استكمال مساره في بناء البنية التركيبة للجملة» وعندئذ يتراجع البرنامج 
(1ماءا0ة8) إلى موضع الإشارة التي تركها في بداية مساره الأول لتجربة القاعدة 
الأخرى البديلة التي تمكنه من استخراج البنية التركيبية الأخرى للجملة؛ فعلى سبيل 
المثال عند تحليل الجملة في (117) نجد أن المحلل أثناء تحليله للبنية التركيبية للجملة ظهر 
له من خلال القواعد أن الجملة تحتمل أكثر من تحليل؛ حيث إن المركب الاسمي «عقد 
مؤتمر للسلام في الشرق الأوسط» يمكن تحليل تركيبه وفقا للقاعدة (/1-أ) فهو بذلك 
يسلك المسار الذي يحقق التمثيل في الشكل (7515-5) ويمكن أيضا أن يسلك التحليل 
مسار آخر بادثا بقاعدة أخرى محتملة في (/1١-خ)‏ فهو بذلك يسلك المسار الذي يحقق 


-155- 


التمثيل في الشكل (2717-54» ومهذه الطريقة يكون المحلل قادرًا على استخراج أكثر من 
تركيب نحوي للجملة. 

أما إذا كان اتجاه التحليل محدد فإن المحلل ينتقل من تطبيق قاعدة إلى أخرى سالكا 
مسار واحد فقط لاستخراج بنية تركيبية واحدة فقط للجملة؛ فلا يضطر البرنامج إلى 
التراجع إلى نقطة سابقة لاختيار قواعد بديلة أخرى. ولمزيد من التفاصيل عن اتجاهات 
بناء المحللات النحوية ينصح بالاطلاع على (2007 ,136005 ي» ,عصنت3). 


ه- اتجاهات بناء المحللات النحوية 


١‏ الاتجاه المبنى على القواعد 

عند بناء المحلل النحوي بالاعتماد على هذا الاتجاه تتم كتابة معلومات عن البنى 
النحوية للغة في شكل قواعد نحوية» وهذه هي القواعد التي يتم من خلاها التحليل 
النحوي للنص المدخل من أجل إنتاج الأشجار النحوية» ويتم عادة تخزين معلومات 
نحوية عن الكلمات المفردة» وهذه المعلومات تتمثل في نوع الكلمة في المعجم والتي 
يصل إليها المحلل قبل تطبيق القواعد اللغوية. ويمكن تلخيص خخطوات بناء المحلل 
النحوي اعتمادا على القواعد اللغوية (2002 ,121682017 111؟1) كما في الشكل .)7١-5(‏ 


الشّكل 0-4: خطوات بناء المحلل النحوي امبني على القواعد. 
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هذه الطبعة إهداء من المركز 
ولا يسمح بنشرها ورقيا أو تداولها تجاريا 
:ا ييا 


في المخطط الموضح بالشكل (750-5) يتم وسم المدخل صرفيًا ثم البدء في بناء البنية 
النحوية للجملة وذلك عن طريق تطبيق عدد من القواعد الموجودة والتي تم الحصول 
عليها مسبقًا على أساس جمل محللة يدويا. وعلى الرغم من انتشار استخدام المحلل المبني 
على القواعد في أنظمة المعالجة الآلية للغة الطبيعية» إلا أن هناك العديد من التحديات 
لبناء هذا المحلل فهو مثلاً يحتاج إلى لقواميس حاسوبية بالإضافة إلى الحاجة إلى لغويين 
حاسوبيين ذوي مهارة عالية لكتابة ولمراجعة القواعد اللغوية. 


"و ه- الاتجاه المبنى على الإحصاء 

اعتمد المحللون المعاصرون في السنوات الأخيرة على هذا الاتجاه الإحصائي في 
بناء المحللات النحوية نظرًا للقدرة المباشرة والسريعة لإخراج النتائج. حيث يتميز 
ذلك الاتجاه بالقلة الملحوظة للقواعد المطلوبة لبناء المحلل النحويء وأيضًا القدرة على 
ضبط المحلل من أجل تحليل نوع معين من النصوص عن طريق استخراج المعلومات 
الإحصائية. ويعتمد هذا الاتجاه على بناء نموذج إحصائي هدفه تحديد الاحتمالات 
الإحصائية للتحليلات المختلفة للجمل. وتعتمد هذه الاحتمالات على استخدام 
عدد ضخم من النصوص الموسومة بمعلومات لغوية كعينات تدريبية. ويعد المحلل 
النحوي الإحصائي أحد الوسائل الشائعة لحل مشكلة اللبس التركيبي» حيث يقوم 
النموذج الإحصائي بحساب أكثر التحليلات احتمالا اعتمادًا على العينات التدريبية. 
ومن أكثر التحديات وضوحًا في هذا الاتجاه اشتراط وجود كميات كبيرة من المدونات 
الموسومة صرقيًا ونحويًا لقلة وفرتها. ومن الملاحظ أن دقة المحللات الإحصائية الحالية 
جيدة ولكنها لم ترقى إلى دقة التحليل اليدوي. يمكن الاطلاع على المزيد عن تقنيات 
التحليل الإحصائي بالرجوع إلى (2013 ,كآمطززلا ع ,خصدا8) . 


“ا ه- الاتجاه المختلط المبني على القواعد والإحصاء 

تواجه المحللات المبنية على القواعد مشكلات وتحديات عديدة مثل اللبس التركيبي» 
كها أن المحللات الإحصائية تعتمد بشكل أسامى على وجود عينات تدريبية ضخمة من 
أجل الحصول على نتائج أفضل بشأن احتمالات التحليل التركيبي للجمل. أي أنه يوجد 
حد أقصى من الكفاءة يمكن تحقيقها عند الاعتماد على اتجاه تحليل دون الآخر ( ,1*0 


-1١58- 


6 ,8163261). فعلى الرغم من أن المحلل الإحصائي قد يعطي أداء أفضلء إلا أنه 
يواجه مشكلات عديدة نتيجة عدم دعم قدرته على مراعاة مرونة اللغة والترتيب الحر 
للكلمات داخل تركيب الجمل (2008 ,1153128312[82' ع4 ,تنه 'كاء8) . 

وللتغلب على هذه العيوب ني كلا الاتجاهين ظهرت بعض الآراء التى تنادي بتبنى 
دمج القواعد اللغوية مع العمليات الإحصائية. فنجد أن محللات الاتجاه المختلط لمبني 
على القواعد والإحصاء تعتمد على القواعد الخاصة باللغة بالإضافة إلى بعض العمليات 
الإحصائية التي تعتمد على الاحتّالات التي توضح مدى انتشار القواعد ومدى تطبيقها 
في الاستخدام اللغوي. فقد وجد أن اللغويون يجيدون كتابة القواعد النحوية الخاصة 
باللغة ويفضلون الاعتتماد على الاتجاه المبنى على القواعد ولكن نظرًا لكثرة الغموض 
التي تسببه القواعد اللغوية كان هناك اتجاه إلى الاعتماد على بعض العمليات الإحصائية 
التى تساعد في عملية فك الغموض التى تسببه القواعد النحوية. وأصبحت المحللات 
الكدرية المبنية على الاتجاه القواعدي الإحفاكن في الآونة الأخيرة أكثر نجاحا إلى حد 
عاق صَمّلئات ادل | الفعري )بر اريك كن العارما تعن الذعاة المنقلط امب غلك 
القواعد والإحصاء يمكن الاطلاع على (2006 ,8168261 تق ,011). ْ 


”- دقة المحللات النحوية 


يمكن النظر إلى المحللات النحوية وتصنيفها من حيث التطبيقات القائمة على هذه 
المحللات وذرجة تحليل وتفصيل المحلل إلى: محلل نحوي سطحي وعلل نحوي عميق: 
فطبيعة بعض التطبيقات الخاصة بالمعالجة الآلية للغات الطبيعية لا تستدعي بناء محلل 
نحوي عميق وكامل» خاصة تلك التطبيقات التى تعتمد على كمية ضخمة من النصوص 
المدخلة؛ حيث إن المحلل المطف كر كانتا قط من أجل الأعراضن الى ليث 
من أجلها هذه التطبيقات. فعلى سبيل المثال برامج استرجاع المعلومات عد شكل 
أسامي على وجود محلل نحوي سطحي يعمل على استنباط وتحديد المركبات الاسمية 
وكات الفعلية. أما التطبيقات الأخرى مثل الترجمة الآلية القائمة على القواعد 
فطبيعتها تستوجب وجود محلل نحوي عميق لفك الالتباس اللغوي واستكشاف كل 
التحليلات الممكنة للجملة. ولسنا هنا بصدد الحديث عن اتجاهين مختلفين للتحليل 
النحوي يتناقضان في طبيعة المسلك المنهجي لكل منههماء إن| هي خطة عمل يتم توجيها 


0 


هذه الطبعة إهداء من المركز 
ولا يسمح بنشرها ورقيا أو تداولها تجاريا 
ا:6:6ا6ا ب | ييا 


حسب الحدف المنشود من بناء المحلل النحوي والتطبيقات الأخرى المستفيدة منه. وكا 
أن كلا الاتجاهين (العميق والسطحي) يختلفان في منهجية ورؤية التعامل مع النص 
المدخلء إلا أن الفصل بينهها فصلاً جذريًا يشكل عقبة في طريق التطبيقات المبنية على 
أساس تحليلي سطحي بحت دون التطرق لآليات التحليل العميق. فعلى سبيل ال مثال 
نجد أن أنظمة تحويل النص المكتوب إلى منطوق تقوم في الغالب على أساس محلل نحوي 
سطحي وظيفته فصل وتقسيم الجمل إلى كتل نحوية ووحدات يمكن الربط بينها داخل 
اليكل الداخلي للجملة. ولكن هذه العملية لا تنطبق دائما بسهولة ويسر. ففي بعض 
الحالات لا يمكن الاكتفاء بآلية التحليل النحوي السطحي بمعزل عن التحليل العميق 
الذي يقدم معلومات لغرية وحلول أكثر عمقا ودقة..وعليه إثه لا مانع من الدمج بين 
النهجين من أجل الوصول إلى رؤية أفضل وتحليل لتركيبات لغوية مختلفة بشكل أكثر 
فاعلية ومرونة (2002 ,2ع11نخآ مها عى ,عطعها8 رتعتتنه8211). 


-5١‏ التحليل السطحي 

ويعرف أيضًا بالتحليل المقداري أو التحليل البسيط أو التحليل الجزئي. ويعرف 
التحليل السطحي بأنه تحليل للجمل عن طريق عملية تجزئة النص إلى كتل نحوية؛ أي 
تقسيم النص إلى كتلٍ» كل كتلة عبارة عن مجموعة كلمات متجاورة تمثل تركيبًا يسهل 
تمثيله ومعالحته منفصلا (رصتطةع10 :2002 ,مع11ن] مولا عع ,عطاعها8 ,عتتتكلة8 
1 01131 ع ,)ع تمتستقطه]7 :2016 ,نإلعع 11-1 ع ,10امتقطة8). وهذا النوع 
من التحليل لا يعتمد على التحليل المفصل لمكونات الحملة» ولا دورها في الجملة 
الرئيسية. وعليه فإن الهدف الأساسى من المحلل السطحى هو تمثيل الجملة عن طريق 
عده غنود هن للعلوفات لقوق ' ْ 

ولقد تعددت اتجاهات التحليل السطحى من حيث اعتتادها على القواعد اللغوية 
داخل بنية الجملة ومن عيف اعقرادفا عل الاسيع لزانت والتكرارات الإحصائية داخل 
النص. فنجد أن الاتجاه المبني على القواعد يعتمد على استخدام عدد من المحولات 
محدودة الحالات (675عنالكصة:1 16ها5 عانهة) لتقوم بمهمة تحديد الكتل الاسمية 
والكتل الفعلية إلخ بناء على القواعد المخزنة. أما الاتجاه المبني على الإحصاء يتم فيه 
تحديد الكتل النحوية عن طريق التعرض لكمية مناسبة من البيانات التدريبية تم وسمها 


11. 


من قبل وتحديد الكتل اللغوية فيها. وتتميز التطبيقات المبنية على آلية التحليل السطحي 
بأنها تتعامل مع كمية ضخمة من النصوص المدخلة؛ فعلى سبيل المثال برامج استرجاع 
المعلومات وبرامج استخراج المعلومات وبرامج التلخيص الآلي تعتمد بشكل أساسي 
على وجود محلل نحوي سطحي يعمل على استنباط وتحديد المركبات الاسمية والمركبات 
الفعلية من الجمل للخل وير اما لاجا اصن القبملة أيضًا تقوم على تحديد العلاقات 
النحو- دلالية داخل بنية السؤال لاستنباط تراكيب بعينها كتحديد الفاعل والمفعول به 
والمكان والزمان إلخ. 

يمكن وصف التحليل السطحي بشكل مبسط كما هو في الشكل (1-5) حيث 
يمر المحلل بعدد من المراحل. أولا مرحلة الإعداد وتشخيص النص إلى كلمات. وهذه 
مرحلة أولية #هدف إلى إعداد النص وذلك عن طريق تقسيم وفصل النص إلى كلمات. 
ثم تأني مرحلة تصنيف أقسام الكلام حيث يتم في هذه المرحلة تصنيف كل كلمة من 
كلمات الجملة حسب نوع كل كلمة وذلك لا يتم بمعزل عن المعجم. وبعد ذلك تأت 
مرحلة التكتيل أي تقسيم النص إلى كتل كل كتلة عبارة عن مجموعة كلمات متجاورة 
تمثل تركيب» كل تركيب يسهل تمثيله ومعالجحته. وأخيرًا ننتهي بالعلاقات النحوية وهي 
موطلة ريظ:الكدل الضحوية يعلاقات تريطها داخل شيكل الخيلة: ْ 


ستاك الجملة لكلمات هر حلة الوسم لكلامي 
100 ومأووة؛ 05ه 


مرحلة التكتيل إعطاء الكلمات الصفات الصرفية التحوبة 
. 0 65م عناع هاو نزة-مطامعماة 
لاضاداسنات ولصمبا و١‏ أن 


تكنبل الكلمات في أجزاء ربط الأجزاء عن طربق علاقات 
»الاداذاء 25 0همداهن 605ملالا ناا عوملكماة؟؛ عماحمعاع0 
[حضر2؟] [الطالب الجديد212] 


الشّكل 1-4: مراحل التحليل السطحي. 


-الاك- 


هذه الطبعة إهداء من المركز 
ولا يسمح بنشرها ورقيا أو تداولها تجاريا 
:ا ييا 


فعلى سبيل المثال جملة (ذهب الطبيب الجديد إلى المستشفى) يتم تحليلها ىا في الشكل 
(5-5"): 


[ ذهب م] [الطبيب الجديد «م«] [إلى المستشفىمم] 


الشّكل 4 -”: التحليل السطحى لجملة «ذهب الطبيب الجديد إلى المستشفى». 

ومن أمثلة المحللات السطحية: محلل كولينز (281561 011155 0©)؛ هو محلل سطحى 
إحصائي تم تطويره بداية كأطروحة للدكتوراه في جامعة بنسلفانيا. وهذا المحلل 
لا يستخدم فقط من أجل تحليل الجمل نحوياء ولكن أيضًا يمكن استخدامه كأحد 
المكونات لتطبيقات أخرى مثل برامج التلخيص الآلي» وبرامج استخراج المعلومات 
وبرامج الترجمة الآلية وبرامج الإجابة على الأسئلة (2004 ,.21 اه ,.خ1 يهقاصة؟1 .3/0). 

ومن الخصائص التى تميز هذا المحلل أن الفئات اللغوية في الجمل المحللة يمكنها 
التمييز فيها بين رأس الجحملة» والمكملات,ء والملحقات. وهذه الفروق يمكن أن توجه 
في بعض التطبيقات لاستخلاص علاقات دلالية هامة. 


5١‏ التحليل العميق 

ويقصد بالتحليل النحوي العميق أنه على المحلل النحوي الآلي توفير جميع المعطيات 
اللازمة للتحليل النحوي الأعمق. والحديث عن العمق هنا ليبس حديث عن النهج 
المبني على القواعد في مقابل النهج المبني على الإحصاء. فالاتجاه نحو التحليل العميق 
يستفيد من كلا المنهجين من أجل الوصول إلى أقصى معلومات لغوية نحوية يمكن 
استخلاصها من الجمل. وأحد أهداف المحلل العميق القدرة على اكتشاف و تحليل كل 
التراكيب النحوية التي ينتجها الإنسان, والقابلية للتعامل مع كل الظواهر اللغوية؛ 
القياسية منها وغير القياسية. والجدير بالذكر أن المحللات العميقة لا هدف إلى تقديم 
تحليل نحوي كامل للجملء كما قد يعتقد القارئ من المعنى الحرفي للعمق. وإنما الهدف 
الأساسي من التحليل العميق هو السعي إلى حل التراكيب النحوية التي تنطوي على 
درجات متفاوتة من العمق والتعقيد» وهذا يتوقف على مدى التعقيد ووجود المعلومات 
اللغوية الأساسية اللازمة لحل مثل هذه التراكيب (2001 ,0مصقط0). 


-5/اا- 


وتواجه التطبيقات اللغوية القائمة على آلية التتحليل العميق بعض العقبات التي تعوق 
عملهاء فعلى الرغم من العمق والثراء اللغوي الذي قد يقدمه المحلل النحوي العميق» 
إلا أن تطبيقه يشكل عبئًا مقارنة بالمحلل السطحى. فنجد أن المحلل السطحيى قد يكون 
اتجامًا أفضل من الناحية التطبيقية لعن فل مها عامل السرعة والوقك النغيلات 
في التحليل» فالمحلل السطحي يتعامل مع الجمل من حيث تقسيمها إلى كتل أصغر دون 
الخوض في تفاصيل ومشاكل أخرى كفك الالتباس والتعامل مع المحذوفات. وهذا 
بالطبع يأتي على حساب العامل الوقتي للمحلل النحوي. وكذلك فإن طبيعة المحلل 
السطحي وكونه يتعامل مع كتل لغوية قصيرة تم فصلها من الجملة؛ فإن هذا يتطلب 
مساحة أقل من ذاكرة التخزين ويؤثر على سرعة وعملية التحليل (5,1996هذ011©). 
كما أنه في حالة إذا أخفق المحلل العميق في تحليل جملة ماء يقوم بإسقاط الجملة بكاملها 
نتيجة لنظرته الكلية للمدخلات. إما في حالة المحلل السطحي فإذا أخفق في تحليل 
جملة فإنه يقوم بإسقاط الكلمات التي يصعب التعامل معها وتكتيلها في كتل محددة دون 
اللجوء إلى إسقاط الجملة كاملة. ويمكننا تقديم مثال للتحليل العميق؛ الجملة (الولد 
ذهب بسرعة إلى البيت) يتم تحليلها ىا في الشكل (77-5): 


[الرورم[ولد ]رمم [ذهبى[بسرعة ]ووم [إلى م[الروم [بيت ]بر ]|موجامم ]م17 ]و 


الشّكل 4 -": التحليل العميق لجملة «الولد ذهب بسرعة إلى البيت». 


- أمثلة للمحللات النحوية 

الآن وبعد عرض بعض الاتجاهات المتبعة عند بناء المحلل النحوي الآلي» سنتعرف 
على بعض أمثلة المحللات الآلية الحالية للعربية. ووجب التنبيه على أن العربية لازالت 
تعاني من نقص في المحللات الآلية والآدوات اللازمة لبناتها. ومن المحللات الحالية 
محلل ستانفورد الإحصائي والمحلل التفاعلي (1471) وهو ما سنقوم بشرح آليات تحليله 
للجملة العربية بالتفصيل. 


لا/اا- 


هذه الطبعة إهداء من المركز 
ولا يسمح بنشرها ورقيا أو تداولها تجاريا 
رب اا لط ط ييا 


-١‏ محلل ستانفورد الإحصائي 

وهو محلل إحصائي يستخدم المعرفة المكتسبة من جمل محللة يدويا في محاولة لإنتاج 
التحليل الأرجح لجمل جديدة. وهذا المحلل يعمل على اللغة الانجليزية ولغات أخرى 
منها الإيطالية والبرتغالية والبلغارية والعربية. 

ومحلل ستانفورد الإحصائي يستخدم تقديرات احتمال الأرجحيّة القصوى 
(112165نأو 000[ناعء1أ.آ مصتاحمن:ة31) لمحساب الاحتالات من القواعد النحوية. 
وهناك مصدران أساسيان للخطأ في التقدير ((2010 ,إ11ز0”26. أولا التحيز الذي 
يكون احتمال الأرجحيّة القصوى له صفر. وثانيا الخطأ في اخحتيار العينات» والذي 
يرجع لمشكلة ضخامة البيانات المدخلة بسبب العدد الكبير من القواعد النحوية. 
ولذلك فإنه من المقبول عمومًا أن يقدم المحلل شكل متجانس يمكن أن يساعد في 
تحسين عمومية تقديرات احتهال الأرجحيّة القصوى في هذه الحالة وتحسين الأداء. وفي 
الشكل (5-5") مثال لتحليل جملة «قام الرئيس بافتتاح المرحلة الجديدة من المشروع» 
داخل محلل ستانفورد: 


5131011010 235: 


:لعكنقم عط ما عمعوقعاوع5 ن ععامه عؤووام 
قام الرئيس بإفععاح المرحلة الجنيلة هن المشروعٌ 


معمعاومة وامدومقة * عأطوعة :موونسووها 
لااعبان ناملا 
قام الرئيس بافتساج المرحيلة الجديدة من المشروع 
1 
01104 المشروع 80( من زل01/ الجديدة /01(08 المرحلة يريو بافساح /01(/8/ الرئيس 80لا قام 


(رالرئيس 4(مل1م) عي 
بافحاح يريم دري 
يزيا 
(( الجديدة يل01) (المرحلة 4«ي«01) ديم 
(زغن لاع مم 


((((((زز المشررع 10000م) عم 


الشّكل 4-4 : مثال لتحليل جملة «قام الرئيس بافتتاح المرحلة الجديدة من المشروع» داخل محلل ستانفورد. 


-5/اا- 


؟ ,/ا- المحلل التفاعلى (للخ1 لزع :زلقصة أ ختاعةنعنم1) 

قامت منظمة لغة التواصل الرقمية العالمية 17/11010) بوضع أدوات لمساعدة 
اللغويين في إنتاج الموارد اللغوية المختلفة. ومن هذه الأدوات التي وضعتها المنظمة 
أداة المحلل التفاعلى (1471) لتحليل اللغات الطبيعية. وهو محلل مبنى على نظرية 
هط وهي نظرية لسانية توليدية من النظريات اللغوية»كم| تم شرحها من قبل في 
جزء المركبات الوسيطة (2010 ,4013 > ,11381 ,لتتدقصقله) . 

والمحلل النحوي التفاعلي يتبنى اتجاه التحليل النحوي من أسفل إلى أعلى. ولتوضيح 
كيفية حدوث التحليل الآلي النحوي في المحلل التفاعلي سيتم شرح المراحل التي يجب 
استخدامها لنقل جملة عربية إلى شجرتها النحوية عن طريق الجملة في :)7١١(‏ 

أكل الولد تفاحة لذيذة )01 


أولاً مر الجملة على القاموس الذي يحتوي على مفردات اللغة وبعض الصفات التي 
توضح المعلومات اللغوية الخاصة بتلك المفردات كالمعلومات المورفولوجية التي تدل 
على الوسم الخاص بهاء ولمزيد من التفاصيل يمكنك الاطلاع على الرابط: 
أععع م5 21_01 /مزطام. عدع لطا / اكلا /اعط. ماع11 0نا.15557// :مقط 
ففي حالة «أكل الولد تفاحة لذيذة» فإن المحلل النحوي سوف يقوم باستخراج كل 
المفردات التي تطابق كلمات الجملة من القاموس كا في الشكل (370-5). 


00 [أكل] 
(8) [آكل] 
«عهم) [ال] 


(لا) [ولد] 
(0) [تفاحة] 
(ل) [لديدة] 


الشّكل 0-4: نموذج من القاموس يمثل مفردات الجملة في (1١؟).‏ 


ففى «أكل» يوجد هناك غموض حيث يوجد «أكل») بوسم اسم و «أكل» بوسم 
فعل. ولكن في هذه الجملة يجب اختيار «أكل» بوسم فعل وليس اسم. وبالتالي فإذا 


-ه/ا1- 


هذه الطبعة إهداء من المركز 
ولا يسمح بنشرها ورقيا أو تداولها تجاريا 
)ُ:6ا ب ييا 


كانت القواعد قادرة على اختيار الفعل بدلا من الاسم فهذا سيسهل عملية التحليل. 

ولكن في حالة اختيار «أكل» بوسم اسم فيأتي دور صفة التفاعلية في المحلل. لأن المحلل 
وبعد الانتهاء من اختيار المدخلات المعجمية المناسبة لمفردات الجملة العربية فيبداً 

المحلل بحذف المسافات بين مفردات الجملة المدخلة لتصبح شكل الجملة المدخلة ى| 

في الشكل (71-5): 

["أكل"] ["ال" ] ["ولد"] ["تفاحة" ["لذيذة'"] 


الشّكل 4 -5: تحديد قائمة مفردات الجملة. 
ثم يبدأ المحلل النحوي بناء المركبات النحوية المختلفة؛ فعند تجاور أداة التعريف 
«ال» - التي تُعتبر المخصص النحوي الاسمي - والاسم «ولد) يبنى المركب الاسمي 
النهائي ى) في الشكل (77-5): 


الشّكل 4 -/1: بناء المركب الاسمى (0815). 
وعند تجاور الاسم «تفاحة») والصفة «لذيذة» يتم بناء المركب الاسمي الوسيط كما 
في الشكل (578-5): 


الشّكل 8-4: بناء المركب الاسمى الوسيط (013). 


-11/5- 


ثم تأت القاعدة النحوية التي تنص على أنه عند تجاور فعل ومركب اسمي ومركب 
اسمي آخر فسوف يتم تبديل مكان المركب الاسمي الأول «الولد» ليسبق الفعل لكي 
يكون هذا المركب موجود في موقع المخصص النحوي للفعل في الشجرة النحوية 
وهكذا يكون المركب الاسمي الثاني «تفاحة لذيذة» في موقع المتمم النحوي للفعل» ىا 
في الشكل (079-5: 

الشّكل 4-4: تجاور المركب الاسمي الوسيط ١‏ تفاحة لذيذة» بجانب الفعل «أكل». 

وهذا المركب الاسمي الوسيط الذي تم بناؤه في الشكل (37-15) يمثل المفعول 
به والذي يتم ربطه بالفعل «أكل» وبالتالي نصل إلى بناء المركب الفعلي الوسيط كما في 
الشكل :)5١0-5(‏ 


الشّكل ١-4‏ 5: تكوين المركب الفعلي الوسيط «أكل تفاحة لذيذة». 
ولاستكال بناء الشجرة النحوية يأتٍ دور القاعدة النحوية التي تربط المركب 
الاسمي النهائي «الولد» والتي تمثل الفاعل مع المركب الفعلي الوسيط لتكوين المركب 
الفعلي النهائي كما في الشكل .)5١-5(‏ 


-لا/لااك- 


هذه الطبعة إهداء من المركز 
ولا يسمح بنشرها ورقيا أو تداولها تجاريا 
!رب 1غ غ ييا 


الشّكل 4 ::١1-‏ تمثيل التركيب النحوي للجملة في (١؟).‏ 
وهكذا يكون قد تم بناء الشجرة النحوية التي تمثل التركيب النحوي للجملة في 
)1١(‏ ويمكننا أيضا كتابة التمثيل النحوي للجملة في (١؟)‏ كما في الشكل (57-5) 
خلال المحلل التفاعلي. 


[5:1] 
(ع0)] 

أكل الولد تفاحة لذيذة 
(ع-ها) 

لسن 

51203, 2:01 


١ :02(‏ أكل 512200 
(تفاحة ٠‏ لذيذة)1113:02 
ولد . ال )2:01لم 
إلصنم! 

5 


الشّكل 1-4 : تمثيل التركيب النحوي للجملة ني )7١(‏ باستخدام المحلل التفاعلي. 
ونجد أن المحلل يقوم بوضع أرقام أمام الفروع المكونة للشجرة لربطها داخل 
هيكل الشجرة النحوية؛ فالمركب الاسمى الوسيط «تفاحة لذيذة» الذي يمثل المكمل 
النحوي للفعل يسمى في الشجرة التي تنتج من المحلل ب 2١77‏ ويربط هذا المركب مع 


-١ا1/8-‎ 


الفعل «أكل» ليكون المركب الفعلي الوسيط الذي يسمى ب 2079. ثم المركب الاسمي 
النهائى «الولد» الذي يمثل المخصص النحوي للفعل ويسمى ب 2١١١‏ الذي يربط 
بالمركب الفعلي الوسيط الذي يسمى 2070 ليكون المركب الفعلي النهائي «أكل الولد 
تفاحة لذيذة». وهكذا نجد أن التمثيل النحوي في الشكل (5-4) يطابق التمثيل 
الشجري في الشكل .)5١-5(‏ 


- بعض النقاط البحثية الحامة من أجل دعم خطة طريق لمعالجة التركيب 
في اللغة العربية 


.ُ 


دراسة القواعد المنظمة لتتابع الأسماء داخل المركبات الاسمية. 


ب. دراسة إمكانية تقسيم الكلمات العربية بشكل يدعم معالجة التركيب النحوي. 


1 


45 


دراسة السمات اللغوية المختلفة للكللات للمساعدة في ضبط وانتظام تطبيق 
القواعد. 


. دراسة الإطار النحوي لمفردات اللغة العربية المختلفة وذلك لإثراء المعجم 


بمزيد من المعلومات النحوية والتي لما فوائد جمة تدعم التحليل النحوي 


لمان العرية: 
دراسة قيود الانتقاء (000251181015 5616016105) لمفردات العربية دعما للمعجم 
ولدوره الجليل أثناء التحليل النحوي. 


. دراسة إمكانية الوصول لقواعد تحديد حدود المركبات المختلقة داخل الجملة. 


التحليل المنهجي لعلاقة منظومة النحو العربي بمنظومتي الصرف والدلالة. 


. إعادة النظر في جهود النحاة العرب القدامى من أجل تنظير أفضل لربط 


التفارياس دده باتته نا لاي 


. تفعيل استخدام النظريات المختلفة للغات الأخرى. مع ضرورة الأخذ في 


الاعتبار طبيعة اللغة العربية. 


. تطبيق نظرية 7-85 على التراكيب المختلفة في الجمل العربية. 


-11/4- 


هذه الطبعة إهداء من المركز 
ولا يسمح بنشرها ورقيا أو تداولها تجاريا 
:ا ييا 


ببليوجرافيا مرجعيّة 


2١١5ص‎ .4-/ جون سيرل. تشومسكى والثورة اللغوية» مجلة الفكر العربىي» عدد‎ .١ 


. 1/4 


مشال زكرياء الألبية والعوليدية والفحويلة وقؤاغد اللغة العرية» الؤشمة 


”. نبيل علىء اللغة العربية والحاسوبء. دار تعريب» .١9//‏ 
-113 امتاعمظ-ء 1طمتخ .(لتتمذ ,2004) .5 مطاعته كا -اط ع ,.5 ,تاتوومكداك . 
/ 11[ ا .5كط10غدء1امحصآ له دع1عصومعته015آ :قططاع 53:5 2100 اكمة؟ 1" عمتطاء 
4 ازع عاطوتذث 02 5655102 5766131 ,ععمع1ع 001 21100221 7تاعام] لالم ]1 

13118112386 6[11ع6م5 


ع1" :3 1[1ن] .(تتعطتوععه2آ ,2010) .1 ,0157م ع ,./طا ماع13[ ,.5 ,1351م 


310531طتاع ام[ 10115 ص[ .ممعاوتزة آلظانا 21مه أ هتعمه 1177لا 2 م16 (قهلاع521 
-031) ,1561517[] 513125 لللث ,11851261118 121811286 01 ععمعء 1ع 0001 

.1 ,10 
7 .(]5ناى للك ,2002) .1 رقاع11نتكا مول ع ,2 ,عطاعةا8 ,./ة .ل وتعتنناه1ل82 . 
جلعءع20 112 .536151311012 60251121816 115128 5125م عع م15 017القطد 
-115ا8 11 00107011621101131) 02 ععطع011م» 11122110021 19115 عطا 01 دع 10 
.5 - 01011121101121) 101 506121101قم .(1-7 .مزم) 1 عسسام١-دوع‏ 


-01 300 1115]16طة10م صا دععمصة0لخ .(2013) .(.805) .لخ ,أامطزالظ! ع» ,.1آ ,املاظ . 
811516559 يك ععمع1ء5 تاعع مم5 .(16 .1/01) دعاع10مصطاععا عماوتهم اه 


0 1605115112655 12 .263:020 3120 23151128 11051151 .(2001) ,2 .ل يلممقطن) . 
-001:016آ رقع 112م5 .(187-204 .مم) لاع 7010طاءع1' اعععم5 220 ع13251128آ1 
اه 


.161128 01 11011012ء5ع0 عط :101 15اع7000 ععتط]' .(1956) .لظ ,تكامطمطن) . 
.113-124 ,(2)3 ,0137ع1 110110316102 جه 005 1أعدقمة" 1 1115 


1 01 53560 23151 51211511631 :77ع2 لل .(عطتتال ,1996) .ل .84 ركصتلام0) .10 


0 1266111285 31تالتطة 341 عط 01 دع صتلعءء0] ص1[ .ودع اع مع لمءمعل 1[دعلعع1 
-4550613 .(184-191 .مم) 051115]165اآ 0131610231امحطمن) 101 126101عوومم 
.1 111210031 ممه ن) 101 ملا 


:14د 


-2100 1151128 :2315128 119:11 .(11197ل ,2006) .117 راع2مع11 ع ,.ك .]ا رطلاه7 .11 
01 01285ع21066 12 .23151 011 طمطنزة 2 :101 15م1ء01ع1م 35 15اع1200 21115 
22 112811156165 1112110031م0022) 5ه ععطع تع غطهن) 2610021 متاعتاص[ 2151 عطلا 
حماآ 1112110021م0طام0ن 101 12601ع50هق عطا 01 عطتأاععطط اقتتصصة 445 عطلا 
.5 0011112110121 101 506121101هم .(321-328 .مم) د165أذاناع 


5 ...166111101165 2315118 .(2007) .ل .ن) ,126005 ع ,.0آ رع0ن0 .12 
511181 .5016266 ناع مده مآ 


.(2016) على .لآ ,تقلععظ11-15 عى ,.ل .10 ,0110متطقكة ,لط .81 ميستطهءط] .13 
<نا10 121122610031 :32217 لق تتتمطتقع عاطهتخ لععطة305 :1اوتخ داع 
,)6 ,17لتقمصبطط للتهة ععمعاء5 121ء50 01 1هم 


1 ,1 .ل ,1[1آ 1[اع::113 ,.11 .1 ,طلا ,.5 رتعاجع1] ,لكآ رممامة>ا .14 

موعع0 لطهة 52211077 12 تإعتتتاعع3 عطة ل0ععم5 .(2004) .خآ بطعن00) ع .ذف 

-[مقتاعة1 ع21281138آ ةمنتنآط عطا 1ه دع طتلعءءء210 2[ .8 0151م عتأمقطاءم1د 

0 16 01 اع1م3طن) تدع 11عمطط طتتها! عطلا 01 ععمعىعكمهن) عه 

."1 ,1263203 .2004 ب[نعخ خا انل :5165 1تاع طاءآ 1120221امحطم0) 101 
5 110012 عتتقتع 221 ,لاع 010م2/101 .(1993) .ل وممتقطدماك 


5 :امل 57ت81 .1010837م2/101 .(1993) ."1 يةطتتهاة] .15 


-160 101 5ع1ة[مططع]' تحتخصظ لوعلءع.ا .(2004) ١.‏ راع ع .1 ,مسصتتدكل/8ة .16 
الآ صا .عساوعوط معءنآ أقناط 


001 :23197515 ع1اع597013 10 0157ع12 511 1ناع12! مم11 .(2006) .لآ ,8/1500 .17 
ملطط .1اع700 أوع101 عتتتطوع1 نه امعطم ماعتكع0 تتممتطوئع 0عامء011-كتام 
10 01 01115157لا ,كأوعطا 


-28315 51211017 5350 ع1نكآ .(2011) [١‏ نتمط0) عى ,.ى .7/1 ,0لعسمتسطقطهك8 .18 
-1505 ,(7)10 وععمطعا5 اع نامدطهم) 01 0111221[ .ع251128ة1 عاطوحخ 101 ره 
.1514 


ع 1110118 11 125765115211015 'طع77ع1ء 10 مع عدوعط1' .(2010) .ل ,تللاع 0*1 .19 
2831251 512115]1631 51211010 


.(1997) .(.1]05) .10 .11 ,07013037 ع ,.'"1 ,218223ا ,./1 ,20.1206107015[167 
.5 21/131125 .51 .12100111101 طلة :5165 1تاعط1]! ك1ة:1ه0 مططع 000 


-1١81- 


هذه الطبعة إهداء من المركز 
ولا يسمح بنشرها ورقيا أو تداولها تجاريا 
:ةا ييا 


101) 01115 11516 ا :85121111131 1131510111121101121' .(1988) .ث ,1530101:0 .21 
1571517منا ع1108طمنهةن) .(1 

5111181 .(2008) .16 11315319[32' عك ,.71 . ١121313[810,‏ ,./1 رت 7كاء5 .22 
-/12 51116101116 1135م 115125 1310011 2[ أكزعا ع13251128 23601121 01 2315128 
-121011013 راء امن 01 10110221 102110021ع مآ .1ع7200 عع قتاعوطة! 61210 
.2-4 ,2008 ,11812661118 210 ,رع 501626 قطنا 555 320 102 


-1١85- 


-١‏ الأنطولوجيا ودلالة اللغة 

؟- التحليل الدّلالي المْمْجَمي. 

#اتالجايقة الدلالية المتكمية ق الله العوزيةة 
تدشيكات]لالايات: لجعي كإطار الطرلر سر دزي 
5- الالتباس الذّلالبي والعمل على إزالته. 

1- تطبيقات التحليل الدّلاني الْمْجّمي. 

بوك انموي اند لؤل لقيية الود ناهةا لعي العري. 
8- التحليل الدَّلاني ما بعد المستوى الُحْجَمي. 


-1١/1- 


هذه الطبعة إهداء من المركز 
ولا يسمح بنشرها ورقياً أو تداولها تجارياً 


-1١85- 


-١‏ الأنطولوجيا ودلالة اللغة 
يعود الانشغال بالدراسات الذّلالية إلى أقدم عصور الحضارات الإنسانية في التاريخ 
البشري المدوّن» حيث انشغل العلماء والمفكرون والفلاسفة ورجال الدين بتأمل العالم 


قات وظواهره واجتهد كل منهم في محاولة تفسير معانيها ونَظّوِها سويًا في سياق عام 
فق أنساق منتظمة. 


وربما كان أحد أنضج قير النظامية التي ل 
ااددات الوجودية ط ما يَعَرَ عنه بمصطلح «الأَنطُونُو جب (00160108) - وهو 
اسمٌ مشتّقٌ من لفظة «أنْطو» اليونانية القديمة التي تعني حَرْفِيا «الوجود أو الكينونة) 
- ويتبواً المصطلح مكانته في الفلسفة كعنوان على أحد مباحثها الرئيسية وَيَعْنَى بدراسة 
طبيعة الوجود» وتصنيف الموجودات/ الكائنات والعلاقات بينهاء والتمييز بين العام 
والخاصء وبين الكليات والجزئيات» وبين ما هو جوهرٌ وما هو كائنٌ» وبين الخصائلص 
الذاتية والصفات الخارجية .]7١[‏ 

وبز رجيات الاق ليضف الالصرا رج لجرا إل لالجو مشر لعا ير 
العمل على الوصول إلى تقسيم طبيعي لكل الُزْئيّات المكوّنة له عند مَفْاصِلِه الأساسية 
بغرض اكتشاف الفئتات التي تندرج تحتها موجوداته. وفي حين أسهب الفلاسفة في 
جدل لا يكاد ينتهي في| بينهم منذ منتصف القرن العشرين الميلادي حول التعريفات 
والمقاربات والطرق المثل لبناء أنطولوجيات مكتملة ومتماسكة» فإنهم لم يقوموا في 

حنيقة الأ تجار ايه انطوالر حا مكتيملة رسفم تكد سيا 


أما ما يمنا من ناحية عملية في هذا الفصل من الكتاب فهو ما قام به الباحثون 
في مجال علوم الحاسبات عمومًا وفي حقل الذكاء الاصطناعي على وجه الخصوصء» 
حيث التقطوا منذ منتتصف سبعينات القرن العشرين الميلادي أهمية مفهوم الأنطولوجيا 
واستلهموه إطارًا لجمع المعرفة وتمثيلها بشكل منهجي منظم يمكن الاستفادة منه 
حاسوبيًا. [1؟] وقد تواكب هذا الاستلهام مع انتهاء باحثي الذكاء الاصطناعي إلى أن 
«الُوا رمات الحاسوبية)”' (41801145125) الحاذقة (ومن أمثلة هذه الخوارزمات 


-١‏ نُذكّر هنا بأن المُوارِْم الحاسوبي هو عبارة عن الوصف الرياضي المفصل للخطوات الحاسوبية التي يؤدي تنفيذها 
لحل إحدى المسائل الرياضية العامة. 
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ولا يسمح بنشرها ورقيا أو تداولها تجاريا 
:6 | ييا 


«أساليب البحث الشجرية 5 0-١-١‏ 1166 ») لا تكفى وَحَدَها لحل المسائل 
الواقعية الجادة» بل لا بد كذلك من مزاوجتها بقاعدة معرفية حسنة التمثيل للمسألة 
المطلوب التعامل معهاء وبذلك فإن خوارزمات المعالجة الحاسوبية الحاذقة بالتزاوج 
مع القواعد المعرفية المحوسّبة (الأنطولوجيات) تشكلان القدمين اللتين يمشي عليه| 
مقاربتها عن الذكاء البشري. 

ومع وجود بعض الاختلافات الفرعية بين الباحثين والمشتغلين بعلوم الحاسب فيا 
يتعلق بالبئى الأنطولوجية؛ فإن هناك اتفاقًا عامًا على مُرِكُباتٍ أساسية لبنيّة الأنطولوجيا؛ 
ومن أهمها: 


. 


ط. 


الموجودات/ الكائنات وأفراد هذه الموجودات © . 


. الئئات/ الأنواع» وتصنيف الموجودات تحت هذه الفئات. 
. العلاقات بين الموجودات (وكذلك العلاقات بين أفرادها). 
. خصائصٌ الفئات (والموجودات تحتّها). 


. الأحداث؛ حيث يشير الحدث إلى تغير في خصائص الأفراد و/ أو الموجودات 


و/ أو الفئتات» و/ أو العلاقات بين أي منها. 

الوظائف؛ وهي التي تسمح بتكوين بِنّى مركبة من الأفراد يمكن التعامل معها 
لاحقا كوحدات أنطولوجية. 

القيود؛ وتوضع على ما يمكن قبوله كمدحلات من صيغ تقريرية لحالة 
الأنطولوجيا أو جزء منها. 


. القواعد (الشرطية غالبًا - في شكل مقدمات ونتائج) التي تصف الاستدلال 


المنطقي الذي يمكن استشفافه من مجموعة الصيغ التقريرية المقبولة. 
المسلّات. 


١‏ - «الإنسان» كائن؛ أما الشخص المسمّى «فلان بن فلان بن فلان» على سبيل المثال فهو فرد من أفراد هذا الكائن» و«الشارع» 
كائن؛ أما شارع «الشَائْزِلِزِيُ» في باريس عاصمة فرنسا على سبيل المثال فهو فرد من أفراد هذا الكائن» ... إلخ. 
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وفي حين أن المركبات المذكورة أعلاه من «أ) إلى «د) هى مركّبات ثابتة (استاتيكيّة) 
في زمن التشغيل» فإن المركبات «ها مع (و) ع يكنات ره (دَيُنامِيكِيّة) في زمن 
التشغيل» كما أن المركّبات من «ز» إلى «ط» هي مركّبات استاتيكية تمهّد الأرضية 
لديناميكية الأنطولوجيا. 

وبينم| يشيع اليومٌ بناء وتوظيف أنطولوجيات على درجة عالية من التفصيل في عدد 
من المجالات الحاسوبية المتقدمة - ومن أمثلة ذلك؛ المحاكاة والألعاب - إلى الحد الذي 
يعتبر معه البعض «هندسة الأنطولوجيات» فرعًا قاًا بذاته من «هندسة المعرفة» . فإن 
حقل حوسبة اللغات الحية يولي اهتمامًا خاضًا بالأنطولوجيا. 

وقد نشأ الاهتمام المكتّف من قبل الباحثين في مجال معالجة اللغات الحية بالأنطولوجيا 
على أساس أنها تستطيع تشكيل الإطار الرابط بين الطبقات الأولية لمعالجة اللغة الحية؛ 
كالتحليل الصوق (الفُونُونُوجِيَ) والصرئّ (المورْفُولُوجيَ) على سبيل المثال» وبين 
الطبقات العليا لمعالجة اللغة؛ مثل (الترابط الخطابي) (10168120100 101560101156) ومعرفة 
«المغزى السياقي للكلام) (86165 مع 213) وهي التي تستلزم كرف بواقع العالم وتفاعلاته. 
ففي غياب إطار معرفي يربط مفردات اللغة وقواعدها الشكلية مع حقائق ووقائع العام 
الذي تعبر عنه با فيه من كائنات وعلاقات بين هذه الكائنات ... إلخ» فإن معالجات اللغة 
الحية تبقى منحصرة في الإطار الشكلي الذي يقتصر على أنواع من المعالجحة الرمزية لا ترتبط 
بها تدل عليه هذه الرموز في واقع استخدامها ]١4[‏ (سواء كان واقع العالم المشترك الجامع 
لعموم البشرء أم كان واقعَ عا جزئي متخصص منه؛ أم كان حتى واقع عا متخيّل)» 
وعندكز يحد هذا الغياب كثيرًا من دقة وامتداد ومردود معالجات أية لغة حية. 

وعلى ذلك فقد اتجهت حوسبة اللغات الحية منذ ثلاثة عقود أو يزيد إلى اعتماد 
لأنطولوجيا إطارًا نموذجيًا لجمع وتمثيل المعرفة اللخوية الدلائية بحيث تمر بين ما 
دونها وما فوقها من طبقاتٍ لمعالجة اللغة الحية. ونظرًا لأن بناء أنطولوجيا كامالة 
بكل مركباتها - المشار إليها عالِيَهُ - وذات محتوى يشمل معرفتنا عن العالم كان 
وما يزال طموحًا شاهمًا يمثل إنجازه مَعْلَا أساسيًا على الطريق الطويلة لحوسبة 
اللغات الحية وتطبيقاتهاء فإنه لم يتم حتى الآن بناءٌ مل هذه الأنطولوجيا الكاملة 
الشاملة لأية لغة حية وهناك جدل بين العلماء عما إذا كان في المستطاع إنجاز ذلك في 
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هذه الطبعة إهداء من المركز 
ولا يسمح بنشرها ورقيا أو تداولها تجاريا 
:ا ييا 


المستقبل المنظور”» وقد أدى ذلك بالعلماء والباحثين العاملين على حوسبة اللغة إلى 
سلوك مَنْحَى عَمِِيّ عبر الاستعاضة عن بناء أنطولوجيا شاملة لِلّغْة ببناء أطر معرفية 
دلالية لِلّغة بعدة أشكال ختصرة ة تستلهم روح الأنطولوجيا وتحافظ على بعض أهم 
مركباتها للتمثيل الدلالي - وخخصوصًا تلك المرقمة عالِيَةُ من أ إلى د - ويمكننا النظر إلى 
مثل هذه الأطر كأنطولوجيات جزئية سواء من حيث مركّباتها أو محتوياتها. 


؟- التحليل الدَّلالى المعحمى 

فود 4د آرر 3 الأطر الالظار ريد الحزئية التي استقر بناؤها بنجاح لحوسبة المعرفة 
اللغوية الدلالية هي تلك التي نحتوي «الدَّلالات المعجمية») (5612812]165 لء ندع ]). 
وكا يُوحِيٍ اسْمُّها فإن الدّلالات المعجمية ل تُمَطّى كامل طبقة المعالحة الدلالية لِلّخة 
الحية ولكنها فقط تشمل المعالحة الدّلالية لمفرداتها وهى مجرد الشريحة الدنيا من هذه 
الطبقة» أما المعالجة الدلالية لما فوق ذلك من تراكيب لغوية (عبارات» حمل فقرات ...) 
فإن محاولات مُقارَبتها حاسوييًا عبر أنطولوجيات أكثر توسّعًا وتعمُّقًا ما زالت في مراحل 
أبكر بكثير» ويعرض الفصلٌ التالي من الكتاب «معالجة الجملة العربية دلاليا بين التحليل 
والتوليد» لمحاولاتٍ رائدةٍ لمعالجةٍ اللغة العربية دِلاليا فيها يتجاوز المستوى المعجمي. 

وفيما نُفْرِد المجال في القسم الرابع من هذا الفصل لتأصيل الكيانات الدّلالية المعجَمية 
كأنطولوجيات جزئية وفق العرض الذي قدمناه في القسم السابق (الأول)» فإن ما تبقى 
من هذا القسم (الثاني) يَعْرِض لِبِنْيَةِ هذه الكيانات والاعتبارات العملية لإنشائهاء ى| 
يتعرض القسم التالي (الثالث) لأمثلةٍ من الكيانات الدّلالية المعْجَمية العربية القائمة 
بالفعل وبعض ما يترتب عليها من معالجات دلالية معجّمية 

ونستطيع أن نرسم صورة دقيقة للدٌّلالات | لتجبية فق لكةما كشبكة هائلة لبط 
كل مفردات اللغة ببعضها البعض عبر علاقات دلالية» كا يمكن أن نُسَّبَّه هذه الشبكة 
بنسيج يمْكِن صياغة حَيْطِهِ الأسامي على النحو التالي: 


-١‏ يحتاج إنجاز مثل هذه الأنطولوجيا الكاملة الشاملة موارد بشريةً وإداريةَ وحاسوبية ومالية هائلة» ولا يُعتقّد أنه من الممكن 
إنجاز مشروع كهذا في زمن مقبول دون تعاون على مستوى عالمي - مثل ما انَبِعَ في مشروع «الجينوم 0600116 - ونرجو 
أن تبادر إحدى المنظمات الإقليمية أو الدولية في أقرب وقت إلى القيام على التوعية بأهميته ومن نّم الترويج لتمويله وتنفيذه. 
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ل 7 
مصسدا نا موي كنا 


أي أن المفرّدة ف, ترتبط بالعلاقة ل مع المفرّدة (أو المفرّدات) ف, 


وبمعرفة ذلك يَسْهل تلخيصٌ وصياغةٌ الوظيفة الأساسية للمعالحة الدَّلالية 
المعجّمية في إيجاد الإجابات الصحيحة على السؤالين التاليين: 
أ. بمعرفة مُفْرَدتِينَ؛ ما هي العلاقة الدّلالية التي تربطهما؟ أي أنَّ ف١‏ مع ف” 
معلومتان والمطلوب هو الحصول على ل. 
ب. بمعرفة مُفْرَّدة وعلاقة دلالية؛ ما هى المفردات التى ترتبط مبذه المفردة الأولى عَبْرَ 
11000 رصي اردان والاويد ا سير عوك 
0 إذن 1ن من رات 9 و «العلاقات ل الكزنين الرئيسيين 
تناومًا بإسهاب في باب لمعيل ا لآل ا اللغة العربية») 0 الكتاب؛ 
راهنا تخدع عات دايا عد لاقام مو عاض اران عله« اوسمم 2م 
مفردةً. بك بد طاو عر ل -ع نوعا 
قله سن رد فين لمر تار 1 لود ريدق ابن لا العلا ماي ببقية المفردات 
وعددها - م - ١‏ عبر إحدى العللاقات الدلالية وعددها 24 وعلى ذلك يمْكِن 
حسابٌ عدد الحالات التي يجب على الفريق فحصّها ونرمز له بالحرف ن, وفقّ الصيغة: 
ريه 
14١ 04- 1( ١ 12-1‏ - ا 


حيث أن م عادةٌ ما تكون عددًا كبيرًا جدًا 
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2 
3 


وهذه الصيغة تُعيّر عن تكلفة فادحة يكاد يستحيل ترنبيها واقعيّاه ولتوضيح 
ذلك نفترض على سبيل المثال عملية بناء شبكة دلالاات معجّمية ببذه الطريقة المباشرة 
كى تخطى دنه آلف مفردة يكن أن تيل ين يعضنها البعضن عشرون خلؤقة ولالية, 
فتكون التكلفة إذن حوالي مئتي مليار حالة فحص <أي اثنان وأمامها أحد عشر صفرًا). 
وبافتراض قدرة اللغوي على دراسة ألف حالة خلال الساعة فإن عدد ساعات العمل 
المطلوبة يبلغ متي مليون ساعة عمل وهو ما يجاوز مئة ألف سنة عمل من فرد واحد! 

ولتجاوز هذه التكلفة الباهظة يجري استدعاء مفهوم دلالي وسيط يسمى في بعض 
الأحيان «فئة الترادف» أو «الحقل الدَّلالي) أو «الَعْنَى الكُلّ) وهو ببساطة معنى أساسي 
عامٌ في اللغة مثل «الحت)» 5 «الكَزه) » «العَمّل) » «النجاح» » «الفشل» , «الصواب» .. 
إلخ» وتندرج تحت كل معنى كلي من هذه المعاني العديدٌ من الكلمات المترادفة؛ وكمثال 
على ذلك نأخذ معنى «التأليف» يد الذي يمكن أن تدوع نحته كلياتٌ مثل 
[١كتاب»‏ 5 «كتابة») 5 «مُؤلّف) اسفر) 5 (رَبُور)» «مخطوط)» «مُصَنف)» يج 3 
«أطروسةة » الرسالة) ...)"2 مع ضرورة التنبيه إلى أن نفس الكلمة قد تندرج تحت 
أكثر من معنى كي واحدٍ وذلك مثل كلمة «عَيْن) التي قد تأت بمعنى ١عضْو‏ الإبصار) 
أو «المَبّع) أو «الجاسوس» أو «العَقَار) . بالخ . ونفترض أن المعاني الكلية التي نعتمدها 


وبجانب استدعاء هذا المفهوم الدَّلاي الوسيط نُنْشَئى افتراضًا دلاليًّا تقريبيًا هاما 


مقاذه أن العلاقة الذلالية بين أَيّ كلمةٍ مندرجة تحت أي معنى كل «أ) وأيّ كلمةٍ 
مندرجةٍ تحت أي معنى كا «ب» هى نفسّها العلاقة الدلالية بين العتن الكلى (أ) 
والمعنى الكلى (ب). 


-١‏ لا يخفى على فطنة القارئ العربي أنه لا تكاد توجد كلمتان عربيتان متساويتان دِلاليا فعللى سبيل المثال عند مقارنة كلمة 
«١كَزْه)‏ بكلِمة ١مَقَت)‏ بدقة يتضح أن درجة الجدّة في الصفة الثانية أشدٌ من الأولى - قال تعالى #إيا أيها الذين آمنوا 4 
تقولون ما لا تفعلون. كَبْرَ مََنَّا عند الله أن تقولوا ما لا تفعلون4* الصَّففَ ,"-١‏ وعند فَحْص دلالة «جلّسَ» بالمقارنة 
مع اَعَد نجد أن فِمْل الجلوس لا يأتيه إلا الشخص القائم/ الواقف بينها لا يلزم ذلك في فعل القُعود - قال الشاعر 
أبو نوّاس (قُل يّنْ بكي على رَبْعِ درس : :: قائًا ما ضَرّ لو كان جَلّس)» ... إلخ. وعلى ذلك فإن أغلب اللغويين يرون 
أن الترادف بين كلمتين يعني عملا شدة التقارب الدَّلاِي بينهما وليس التساويّ التام. 


-19:6- 


ولإقامة شبكة الدّلالات المعْجّمية «التقريبية» عبر هذا المفهوم الدلالي الوسيط فإن 
علينا توفير فريق لغوي يَدْرُسٌُ كُلّ مفردة من بين فئة المفردات (وحجمها م مفردةً) 
ويبحث وقوعّها تحت كل معني كلي من فئة المعاني الكلية (وحجمها ح معتّى كليًا). 
إضافة إلى دراسة احتمال اتصال كل معنى كلي بباقي المعاني الكلية وعددها - ح - ١‏ عبر 
إحدى العلاقات الدلالية وعددها -ع, وعلى ذلك يَمْكِن حساتثٌ عدد الحالات التي 
يجب على الفريق فحصها ونرمز له بالحرف ن؟ وفقٌ الصيغة: 


داه نه دك يه ب ونوك انك يه 


11١5 + 521‏ رط 11١5 + 5١ )9- 1( ١‏ - رلا 


وهذه الصيغة تَعيُر عن تكلفة أقل بكثير من الأولى بافتراض نفس عدد المفردات 
ونفس عدد العلاقات الدّلالية؛ ومع افتراض عددٍ من المعاني الكلية يساوي ألا على 
سبيل المثال تكون التكلفة إذن حوالي مئة وعشرين مليون حالة فحص وهو ما يكافئ 
ثلاثة وستين سنة عمل من فرد واحد'"' وذلك أقل من التكلفة الأولى بنسبة تقارب 
ألف وستمئة وستة وستين مرةً. 

ومن الجدير بالذّكُر أن الوعاء اللغوي الذي تندرج فيه مفردات اللغة في بجموعاتٍ 
تحت معان كلية يُشَكل كيانًا كنحدا كرف تقليدنا باسم (مَكْبَرْ) (11658102105), ومن 
بين المكانز العربية المعتبرة تلك المراجع المشار إليها فى نباية هذا الكتاب بأرقام ["؛ 5 
ا ]١١ ١‏ وتُعتبر هذه المكانزٌ وأمثامًا نقطةً انطلاق لا غِنَى عنها لبناء أية شبكةٍ 
دالب م قري ليا 


أما العلاقات الدلالية فمنها علاقتان حيويتان لا غِنَّى عنهما لبناء أية شبكة دلالية 
معجّمية؛ الأمل علاقة «الترادف» وهي التي يرتكز عليها استغلال المفاهيم الدلالية 
الوسيطة كا سَّ شل عر عه عاليه والثانية علاقة «الاشتالية» وهي علاقة العام بال مخاص؛؟ 
وتتايز إلى علاقة انوع من 1120-01 - -15) مثل علاقة «السرير كنوع من الأثاث» وعلاقة 
(فَرْد من 7661-01عط-15» مثل علاقة «السنجاب كفرد من الثدذييات القوارضص» 


-١‏ أو سنة عمل واحدة من فريق به ثلاثة وستين فردًا يقسم بينهم العمل بالتساوي. 


- 


هذه الطبعة إهداء من المركز 
ولا يسمح بنشرها ورقيا أو تداولها تجاريا 
:ا ييا 


وتكون علاقة الاشتالية «التصنيف الهرمي» ((13<00072) لشبكة الكلمات"' مع 
ملاحظة أن الأفراد لا تكون إلا في آخر مستوى من هذا التصنيف. 

وامخ العللاقات الثلالية عللاقات أساسية شهيزة لآ يمكن أن تغيب عن أية شحة 
دلالية معجمية : 

أ. علاقة «التضاد) ؛ مثل علاقة معنى «الكَّسَل) كمضاد لمعنى «التشاط). 

ب. علاقة «السببية» ؛ مثل علاقة معنى «الأكل» كسبب لتحقيق معنى «الشبع». 

ج. علاقة «الشرطية» ؛ مثل علاقة معنى «الزواج» كشرط لوقوع معنى «الطلاق)». 

د. علاقة '«الحاليّة الزمانية)؛ مثل علاقة معنى «السّهّرا الذي يمحل في زمن 

«الليل». 

ه. علاقة «الحالية المكانية» ؛ مثل علاقة «السَّمّك) الذي يحل في «الماء). 

و. علاقة «الحزئية» ؛ مثل علاقة «الأنف») كجزء من (الوجه)». 

وهناك أيضًا العديد من العلاقات الدلالية التى تعد اشتقاقات تفصيلية لما سبق من 
علاقات دلالية أساسية» فضلاً عن أن بعض الشبكات الدلالية المعجمية تتضمن أيضًا 
معكوس العلاقات الدلالية المذكورة عاليه؛ ومن ذلك على سبيل 0 «الَحَلية الزمانية») 


كمعكوس لعلاقة «الحالية الزمانية» وذلك مثل علاقة «الليل» كمّحَل «للسهر).؛ كما أن 
علاقة «الكلية) معكوس لعلاقة «الحرئية» وذلك مثل علاقة «الوجه» «بالأنف).... إلخ. 


ومن الواضح تبعًا لصيغة حساب التكلفة ن' التي اشتققناها عاليّة أن تكلفة بناء 
الشبكة الدلالية المعجمية تتزايد باطراد متسارع مع زيادة عدد العلاقات الدلالية ح بين 
مفرداتها. 
ما تقدّمَ في هذا القسم يتبين لنا أن بناء شبكة دِلالية مُعْجَمِةٍ ذاتٍ تغطية واسعةٍ لمفردات اللغة 
وللعلاقات الدّلالية بينها يتطلب عملاً غزيرًا يقوم به فريقٌ متجانسٌ منظمٌ من اللغويين 
المتمرسين في علوم الدّلالة والصرف والْكَانْز والمعاجم. 


-١‏ وهو ما يناظر تصنيف الكائنات في الأنطولوجيا الذي ذكرناه في القسم الأول من هذا الفصلء والذي نعود إليه في 
القسم الرابع من هذا الفصل لتأصيل الشبكات الدلالية المعجمية كأنطولوجيا لغوية جزئية. 
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*- المعاجَة الثّلالية المكمية فى اللغة العربية 
يمكن تصنيف المقارَباتٍ المتبّعة في بناء الشبكات الدلالية المعجمية إلى الطريقتين 
الآتيتين اللتين تؤديان إلى نفس الغاية مع بعض الاختلافات التفصيلية: 


.ُ 


0 المقارّبة الأول اصطلاحًا «شبكة الكلمات» (72181 11701710) [/7ا7] 
حيث تُجِمّد فيها «فيةٌ المترادفات» (561 ا المفهومَ الدلاليّ الوسيط 
المشارٌ إليه في القسم السابق فَيمِْنٌ مثلاً تشكيل فئةٍ ترادّفٍ ما يلي من كلماتٍ 
مترادفةٍ (متقاربة دلاليا) [١مُعَلّم)‏ » (مُدرّس)» (أستاذا» «مؤدّب», «مُري ا 
شيخ «مُحاضر) ... إلخ]. وكا ورد في القسم السابق فإن المفرّدة ذات 
الدّلالات المتعددة قد تنتمي لأكثر من فئة مترادفات واحدة» ويتم شيو 
على فئات المترادفات هذه عَبْرَ استقراء حصيلة المفردات ورب مع الاستعانة 
ببعض الْكَانْزْ الموسّعة كنقطة انطلاق» ونتيجة استقراء المفرّدات في الاتجاه من 
أسفل (المفردات) إلى أعلى (فئات المترادفات) فإن هناك ميلاً إلى كبر عدد فئات 
المترادفات ح. أما العلاقات الدّلالية من مثل الأنواع التي وردت في القسم 
السابق فهي تصل بين فئات المترادفات زِيابةَ عما تتضمنه من مفردات وهذا على 
وجه التقريب, وهو كم بَينّا ما يجعل تكلفة بناء شبكة الكلمات ممكنةٌ من الناحية 
العيية 

وقد بدا تطوير «شبكة كلمات اللغة الإنجليزية» (6ع51 11/050 «ماءععصمةط) في 
جامعة برينستون عام 1945م11؟] كأول شبكة دلالات مُعبمية محوسَبة تتّبع 
اغلوب شك الكل شود عؤال مد ةلت لمن نطو فبكات الكرات 
لتغطي العديد من لغات العالم تحت مظلة «شبكة الكلمات العالمية» (6105821© 
١[ 001+‏ ”] التي تضم الآن عددًا واسعًا من اللغات الحية (والأوروبية 
منها بصفة خاصة) با فيها اللغة العربية. ومن الجدير بالذكر أن منظومة شبكة 
الكلمات العالمية تعتمد المواصفات والمعايير المتّبَئعة في كل من مشروعَيْ «شبكة 
الكلمات الإنجليزية من برينستون» » و«شبكة الكلمات الأوروبية» (متناآ 
١/1 )1120101 21‏ ]. 


.51/8011/015-56©1 الاسم الاصطلاحي 5[/0-561 هو مختصّر شائع للاسم الكامل‎ -١ 
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هذه الطبعة إهداء من المركز 
ولا يسمح بنشرها ورقيا أو تداولها تجاريا 
ا:6ة6ا ب | ييا 


يق ١‏ | المقارية الثانية فهي «الرَّبْط الدّلائي المعجّمي عَبْرَ الحقول الدلالية» » حيث 
تسد فيها «الحقل الدَّلالخٌ) (11610 علاسقحمء5) [5 ؟] المفهومَ الدّلايّ الوسيطة 
ويمثّلٌ 1 حقل دلالي أحدّ المعاني الكلية الأساسية القائمة بذاتها مثل (الحٌبّ) 
«العَمّل). «المنافسة «المال»)ء, «السّلاح»)» «الْمسَكن). «الدّراسة». «الطعام» 3 
اوري اراي مر اللو لال 1ك تعبيرًا عن 
دلالتها.ء ويمكن بالطبع أن تقع نفس المفردة ذات المعاني الحددة فت اكترمنق 
حقل دلالي واحد لا 0 الذّلالية 
فإنه تجري الاستعانة بِالَكَانِزْ الموسّعة. ونظرًا لأن إنشاء الشبكة الدّلالية عبر هذه 
الطريقة يتمدد من الأعلى (أي الحقول الدّلالية) إلى الأسفل «المفردات) فإن 
هناك ميلاً إلى تحجيم عدد المفاهيم الدلالية الوسيطة ح. أما العلاقات الدّلالية 
فهي تصل بين الحقول الدّلالية نِيابةَ عما يقع تحتها من مفردات وهذا أيضًا على 
وجه التقريب» وهو ما يجعل التكلفة الاقتصادية لهذه المقارّبة أكثر جاذبية. 
وبالظاز: ]ل ماتخرض إنجاله بالفعل من شبكات:«الالانف سعكمة زلكة العرييةفإننا 
لا نجد حتى تاريخ كتابة هذه السطور(١)‏ سوى القليل من الناذج التي يمكن الاعتداد 
بها ونذكر منها اثنين هما الأكثر اكتّالا من حيث تغطية المفرّدات العربية وثراء العلاقات 
الذلالية بينها: 


-١ ,“‏ أما النموذج الأول فهو (شبكة الكلمات العربية» 2160 170:0 وذطهتة) 
3 ] وقد جرى تنفيذه حسب الأسلوب الأول المذكور عالِيّهُ؛ «شبكة الكلمات». وقد 
بدأ العمل في شبكة الكلمات العربية عام ألفين وخمسة ميلادية كأحد مشروعات ١شبكة‏ 
الكلمات العالمية» 216 710150 10521 6)». وقد جرى ابتداءً إنشاء المحتوى المعجّمي 
لشبكة الكلبات العربية نقلاً (عبر الترجمة) عن محتوى الإضدارة الثانية لشبكة برينستون 
للكلمات الإنجليزية ١/1‏ ]. وضع ترق شيكة الكلابع العر هون انيه الات 
فئة ترادف وحوالٌٍ عشرين ن ألف مفرّدة (أو تعبيًا مركبًا) وحوائ مئة ألف من الأزواج 
المرئّة (مفرّدة» فئة ترادف)» | أَجْرِيَتْ بعضُ التحسينات على هذا المحتوى المعجمي 
لتوسعة تغطيته وخصوصًا عبر توظيف أدوات معالجة لغوية لتمكين التعامل بمرونة 


١‏ - أي في غضون الفترة ١١701م/‏ 17١7م‏ حيث جرى تأليف الطبعة الأولى من هذا الكتاب. 


-195- 


مع البنية الصرفية للكلمات العربية”". وربهما كانت أهم أوجه النقد التي تُوجّهِ لشبكة 
مح ع لسع سه ل 0" 
و ل ل و 
العربية ما زال يعتبرها على طريق طويل من التطوير والتحسين''' فإن هذا العمل يبقى 
ذا قيمة معتبّرة خاصة وأنه متاح بشكل مفتوح المصدر للجميع. 

*,7- وأما النموذج الآخَر فهو «قواعد بيانات الدّلالات المعجّمية العربية عبر 
الحقول الدّلالية» (105ء11 عتأصقدء5 112 ع5ة12]26 دع تاصقص 5 لمع ترآ عتط وتم ) 
[19] والذىئ خرئ تفيذه. عبت الأمتلوت القاي الكرزو غالية #التئط الدلال 
المعجّمي عَبْرَ الحقول الدّلالية» بواسطة «الشركة الهندسية لتطوير تُظّم الحاسبات (آزْ- 
دِي-آيْ)) (تنامه.ع»-5.1101 :18101) التى عكفت على بناء وتطوير هذه الشبكة 
الدّلالية المعجمية العربية بين منتصف عام 6١١٠م‏ حتى بداية عام ١1١7م‏ بدعم 
وتهقويل جرم مق «مركز تميز التنقيب المعلوماتيٍ والنمذجة الحاسوبية / / :ماغط 
0126172.611.6011.8» بمصر بين بداية عام 5 ١٠١٠م‏ إلى بداية عام ١٠5٠7م[15].‏ وقد 
مر العمل عبر هذه السنوات بثلاث مراحل؛ حيث امتد الإنجازٌ مع إتمام المرحلة الثالثة 
في بداية عام ١١١7م‏ ليشمل نحو مئة ألف مفردة عربية صريحة تندرج تحت مستويين 
من الحقول الدلالية؛ مستوّى أسامييٌ عام به نحو ألفين من المعاني والمفاهيم الكلية» 
ومستوى اتانودى ل يتتشعب إلى حواك ثرانية عشر ألما وأربعمئة حقل دلالي أكثر تفصيلاً 
لتصنيف المعاننَ الكلية وفقّ الصيغ الصرفية” "© ووققٌ بعض التضنيفات الذّلالية©. 


-١‏ توظَّف شبكةٌ الكلمات العربية الآن المحلّلٌ الصرفي العربي "تِيمْ باكْوُولْرَ بها لهبجاءبا8 م1 
7/,[507621210810-1.1)29تأطتآع 1/02182108/021210الء .تطءمنا.ع1140://.10 وذلك لربط 
حصيلة واسعة من الكلمات العربية الخام التي قد يُطْلَبٍ الاستعلام عنها دلاليًا بالحصيلة المحدودة الواردة على نحو 
صريح في الشبكة (راجع فصل «التحليل الصرفي الآلي للمفردات العربية» من هذا الكتاب). 

؟- انظر عم .11 -7/010171-001771712008كع 1طو 1خ /1210/005/20058آ. داع 1717/7/.7055//: مقط . 

7- هذه الأصناف الصرفية الأربعة عشر هي [اسم آلة» اسم تفضيلء اسم ذات» اسم زمان» اسم فاعل» اسم معنى» 
اسم مفعول» اسم مكان» اسم منسوبء صفة مُشْبّهة» صيغة مُبالّغة» فِغْلء كلمة وظيفية» مَصْدَر) . 

5 - هذه التصنيفات الدّلالية هي (حَدَتْء مَعْنََه فاعل» مفعول. صفة مشبّهة» تفضيلء ذات» مكانء زمان» كلمة 
وظيفية] . 
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هذه الطبعة إهداء من المركز 
ولا يسمح بنشرها ورقيا أو تداولها تجاريا 
:ا ييا 


وترتبط هذه الحقولٌ الدّلالية بعضّها ببعض عبر عشرين نوعًا ما أشرنا إليه من 
علاقات دلالية في نهاية القسم السابق سواء أكانت علاقات أساسية أم مشتقة أم 
معكوسات هذه وتلك» وتتحكم التصنيفاتٌ الصرفيةٌ والدّلالية للحقول الدّلالية في 
المستوى الثانوي في| ينطبق وما لا ينطبق بينها من علاقات دلالية؛ فعلى سبيل المثال 
لا تقوم علاقةٌ الحالَيّة الزمانية إلا بين حدث ورَّمَّنَء ونتيجةً لذلك فإن قيمة ح المَعّالة 
المستخدّمة في حساب تكلفة إنشاء الشبكة الدّلالية هي ألفان وليست ثانية عشر ألف 
وأربعمئة. وفي محصلة ذلك كله فإن لدينا في نسيج الشبكة أكثر من مئتين وثلاثة وتسعين 
ألفَ وصلة دلالية تربط الحقول الدّلالية بعضّها ببعض 

ومن الحدير بالذكر أن:المية ألف مفردة المندرجة في قاعدة بيانات الربط الدلالي 
المعجمي هذه ليست جرد كلمات عربية تهائية وإنا هي مُركّبات صرفية مرنة يمثّل كل 
منها عددًا كبيرًا من الكلمات النهائية المكوّنة من تباديل هذه المركبات مع اللواصق؛ 
مثل ١مَكْتّب»‏ التي تمد أيضًا (المكتبء لمكتبه» فالمكتبان» مكتبناء بمكتبي» ...)» وذلك 
تحت د : 500 ضمن نفس دلالتها و تستخدم آز -دِي-آيْ هذا الغر ض أدواتها 
للتحليل الصرفي والعنونة النحوية »]١5[‏ وعلى ذلك فإن هذه المئة ألف من المفردات 
تغطي فعليًا عشرات الملايين من الكلمات العربية النهائية مما يؤشر على مراعاة طبيعة بنية 
اللغة العربية في تصميم هذه الشبكة الدّلالية المعجّمية. وقد كانت ثُوَاة إنشاء محتوى هذه 
الشبكة الدّلالية هي «المكْثر الكبير» [4 ] وهو عمل قَيّم أنجزه فريق كبير من الباحثين تحت 
قيادة عالم اللغة الشهير الراحل «أ.د. أحمد مختار عمر) لرصد الحقول الدّلالية الأساسية في 
اللغة وإدراج المفردات العربية تحتهاء ثم أَخَدَّتْ بعين الاعتبار عدة مصادر أخرى فيما بعد 
عند تنقيح محتوى الشبكة الدّلالية ["؛ 5 /87: 4: ]١7 1161١‏ فضلاً عن الاستفادة 
من «شبكة الكليات العربية» (7161 777010 ع131ثى) السالف ذكرها. 


و 3 04 و ٍِ 
4 - شبكات الدّلالات المعْجمية كإطار أنطولوجيٌ جزئى 
يُمكِدْنا الآن تأصيلٌ الشبكات الدّلالية المعْجّمية - سواء لعبت فئات الترادف أم 
الحقول الدّلالية دَوْرَ المفاهيم الدّلالية الوسيطة فيها - كأنطولوجيات جزئية وفق 
العرض الذي قدمناه في القسم الأول من هذا الفصلء وذلك بالترتيب على النحو التالي: 


اه 


أ. كائنات الأنطولوجيا وأفرادٌها تناظرٌها المفردات في الشبكة الدّلالية. 

ب. الفئاث/ الأنواعٌ في الأنطولوجيا تناظرها في الشبكة الدّلالية المفاهيمٌ الدلالية 
الؤسيطة - سواء أكانت فئاث ترادف أو حقولاً ولالية - ى) أن التصنيف 
الحرمي لهذه الفئات في الأنطولوجيا تمثلّه في الشبكة الدّلالية علاقةٌ الاشتهال. 

ج. العلاقات بين كائنات الأنطولوجيا تناظرٌها العلاقاثٌ الدّلاليةٌ بين المفاهيم 
الدلآلية الوسيطةك يواه أكاتك فاك تزادك أو جفولة وللالية حوبا لجبعية وت 
ما يندرج تحتها من مفرداتٍ وهو التقريبٌ الذَّلالٌ العمل الذي ذكرناه. 

د. خصائصٌ الفئات/ الأنواع والكائناتٍ تحتها في الأنطولوجيا تناظرٌها الخصائص 
الصرفيةٌ والدّلاليةٌ (المذكورة في الملحوظتين الهامشيتين رقم ١١‏ و ١١‏ عاليّة) 
التى تؤدي لتفصيل الحقول الدلالية الأساسية إلى حقول دلالية ثانوية. 

ومن الملاحظ أن عناصرٌ الأنطولوجيا الحاضرةً في الشبكات الدّلالية المعجمية هى 

تلك امكو نات القافة الاشافكة )ابه] تكب يقي غداضن الألطر لريفيا ف كوبا 


أنطولوجية متحركة (ديناميكيّة) إضافة إلى تلك التي تمثل حقائقٌ العالم الخارجي 
العامة المعلومةً خارج إطار النص لكنها حاكمةٌ لفهمنا الدّلاي له» وما ل ثُيَمّ الأبحاث 
والنقنبات انقالئة | نمجاة هذ الكر نانت"الأنطولوتعية الدامكية نان الطزيق )لا ذال 


طويلةَ نحو تجاوز المستوى المعجّمي في التحليل الذَّلالي لِلّغة الحية. 


ه- الالتباس الدَّلالي والعمل على إزالته 

ينح التحليل الدَّلاليُ المْجَمي لكل كلمة - بصفةٍ عامةٍ - عدةً أجوبة تُكِنةٍ وهو ما 
رف باسم «الالتباس اللاي المعجّمي) (/جاأناى أطحصخ ع اهم 5 ا وعتهعء.])» ويرجع 
هذا الالتباس إلى تعدٌّد المعاني الكلية للمفرّدة الواحدة مما يؤدي إلى تعدّد الحقول الدّلالية 
التي تندرجُ تحتها (أو فئات الترادف التي تنتمي إليها) هذه المفرّدة؛ فعلى سبيل المثال 
تتعدّدُ المعاني الكلية للكلمات العربية «عئن») (قَضْر) » الهجاء) » (مَضْرف») » عضرا على 
النحو التالي بالترتيب (ِعَضو الإبصارء تَبّع» جاسوس» عَقَاره ذات الشَّيْء .-.]) ملع 
مَسَكَنٌّ فاخرٌ متّسع ...» [الذَّمٌ تكوين الكلمات من الحروفء ...» (مؤسّسة مالية» 


“0 


هذه الطبعة إهداء من المركز 
ولا يسمح بنشرها ورقيا أو تداولها تجاريا 
:ا ييا 


إنفاق المال» مَهْرَبِء ...)1 (حقبة زمنية» أحد أوقات اليوم» ...). وتُعَدٌ مسألةٌ «فك 
الالتباس الذلان للكلوات» (24102نا5 1ط حطة1(15 عذدء 5 17/0:0) إحدى المسائل العتيدة 
العنيدة ة التي لم يتم حَلها بَعْدُ بشكل مُرْضٍ سواء في اللغة العربية أم في سواها. ينا 
أثمر تطبيق أساليب التعلّم الحاسوبي لفك الالتباس الصرفي - عَبْرَ ترجيح التحليل ذي 
الاحتمال الرياضي الأعلى ضمن سياق التحليلات الصرفية الممكنة للنص المحيط 00 
عو مدا للك عا موشففية إلى حرس مقي 31 1"افكلى الاين أذاء التطبيقات المرتكزة 
على هذا النوع من التحليل» فإن هامش الخطأ الناتج ص استخدام نفس الأساليب لفك 
الالتباس الدلالي للكلمات أوسع كثيرًا من ذلك حيث لم يقل في أمثل الأحوال مع اللغة 
الإنجليزية عن خمسة وعشرين في المئة وقد يرتفع إلى ما فوق الثلاثين في المئة مع اللغة 
العربية”" وهو ما يعرقل أداءً التطبيقات المرتكزة على التحليل الدلالي المعْجَمى - 
بعضًا منها على الأقل - مما سنأي على ذكره في القسم التالي من هذا الفصل [1]. 
ويْمْكِنْ تفسير رُ اتساع اي الخطأ في قَكُ الالتباس الدّلالي للكلمات غزة أساليت 
التعلّم الحاسوبي تقارنة ا نم نفسٌ الأساليب مع مسألة قَكُ الالتباس الصرفي 
بحقيقة بحقيقة أن السياقٌ الاحتمالّ الدَلائيّ في النص أكثرٌ اتساعًا في المتوسط من نظيره الصرفي» 
فا ترقبطٌ دلالة الكلمة فقظ بالكلات القليلة المجاورة ها ولكنها كنيدا ما تتاثر أيضا 
بكامل الفقرة”" التي تَرِدُ فيها (بل ربا تتأثر كذلك با يتجاوز فقرتها تما هو داخل وما 


-١‏ وذلك كما جرى استعراضّه في نباية القسم الثامن من فصل ١‏ التحليل الصرفي الآلي لمفردات اللغة العربية» في هذا الكتاب. 

؟- حيث يُمْكِنَ للمحلّلات الصرفية العربية رفيعة الأداء أن تصل ببذا امعد للخطأ إلى ما دون الخمسة في المئة عند 
التدريب والتقويم على كامل اتساع الفضاء اللغويء بين يُمْكِن أن ينخفض إلى نحو الثلاثة في المئة عند التعامل مع حيز 
ضيق من الفضاء اللغوي, وذلك أيضًا كما جاء ذِكرٌه في نباية القسم العاشر من فصل «التحليل الصرفي الآلي لمفردات 
اللغة العربية» في هذا الكتاب. 

"- علينا الانتباه إلى أن هامش المخطأ في فك الالتباس الصرني العربي داخل أيضًا في هامش خطأ فك الالتباس الدّلالي 
للكلمات العربية؛ فنظرًا لقلة عدد المفرّدات المذكورة بشكل صريح في أية شبكة للدّلالات امحجّمية (من أجل الحفاظ 
على تكلفة معقولة لبنائها) مقارنة بحجم الحصيلة الكلية للمفرّدات العربية» فإن الكلمة العربية المطلوب تحايلها تحليلها دلاليًا 
لابن ا أن تمر أولاً على لل صرفي يها إلى إحدى مشتقاتا المذكورة صراحة في قاعدة بيانات شبكة الّلالات 
المعسجّمية (كما سبق ذِكْرُه في القسم الثالث من هذا الفصل). 

5- هذه الكلمة «فقرة» في هذا الموضع مثالٌ بين على ذلك؛ حيث لا نستطيع تقرير ما إذا كان معناها المقصود هو اجزء 
من النص» أو «جزء من برنامج» أو «حلقة في العمود العظمي للحيوان الفقاري» ... إلخ إلا إذا وسعنا إطار السياق 
المحيط بها لكي يشمل قرائن من كلمات تسبقها بمسافةٍ بعيدةٍ مثل ١نّصٌّ)‏ و «بالكلمات» ويشمل كلمات تلحقها بمسافة 
بعيدة مثل ١كَلمة).‏ 
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هو خارج النص)؛ فإذا كان يُمْكِن تحقيقٌ هامش خطأ صغيرٍ في عملية فك الالتباس 
الصرفي بدراسة سياق احتمالي ضيق لكل كلمة يمتد لكلمتين أو ثلانّا ما يسبقها وأخرى 
مثلها نما يلحقهاء فإن تحقيقٌ هامش خطأ مقارب لذلك في عملية فك الالتباس الذّلالي 
ربا يحتاجُ لدراسة نحو عشرة أو عشرين كلمة مما يسبقها وأخرى مثلها ما يلحقهاء وهو 
ما يتجاوز بكثير القدرات“الراهئة للمعالحات الخاسؤبية”). 

وقد تستطيعٌ بعضٌ التطبيقات المرتكزة على التحليل الذَّلالي المعجّمي أن تتجاوز 
ذلك المعدل المرتفع للخطأ في فك الالتباس الدلالي آلا عبر استغلال بعض القيود 
الإضافية التي تنشأ عند استدعاء الدّلالات المعجّمية في مثل تلك التطبيقات» ومنها 
على سبيل المثال: 

-١ ©‏ الاستفادةٌ من ضِيق التُطاق اللغوي للتطبيق عَبْرَ إنشاء شبكة دلالية مُعْجَمية 
مكرّسة لذات التّطاق اللغوي الصَيّقَ؛ فيُمكِن مثلاً تنفيذٌ ذلك في تطبيق لاسترجاع 
المعلومات حول «الآفات التي تصيب الحاصلات الزراعية الصيفية في صعيد مصر) 
فالبعدٌ الجغ راف مقيّد بصعيد مصر والزَّمَنِيٌ مقيّد بالزمن المعاصر والموضوعيٌ مقيّدبآفات 
الحاصلات الزراعية الصيفية والأسلوبّ غالبًا سردي تقريريٌ» ولذلك فإن كلماتٍ مثل 
«فطر» و «الجذّر» و «حرارة» سوف تقتصر معانيها - على الترتيب - في الأنطولوجيا 
التي يرتكرٌ عليها هذا التطبيقٌ على «نوع من النباتات اللا حَضّرية التي تتكاثر لا 
جِنْسيًاا (مع تراجع معاني («تناول طعام بعد امتناع عنه). ...)) ثم «القسم الأسفل 
من النبات تحت الأرض» (مع تراجع معاني [«الأصل»» «السبب»» «القاعدة»....]) 
ثم «السخونة» (مع تراجع معاني ((شدة العاطفة»» «الحماس والشغف». «علامة على 
استعداد الآلة للعمل»» ... 1). 

ه, 7- الاستفادة من عدم الحاجّة أحيانًا إلى الحصول على المعاني الأكثر تفصيلاً 
للكلمات والاكتفاءٌ بالمعاني الأعم لها فقد يَصْلّحُ ذلك مثلاً في تطبيق لتبويب المقالات 
تحت عدد محدود من الأقسام العامة في إحدى المواقع الصحفية الإلكترونية. وفي هذه 


اذا 


4 


-١‏ تتضاعف القدراثٌ الحاسوبيةٌ المطلوبةٌ لمعالجة سياق احتمالي مع زيادة اتساع هذا السياق وفقٌ نمط أَمّينْ وليس خطيّاء 
ولذلك فإن الفارق مهولٌ بين القدرات الحاسوبية المطلوبة لدراسة سياقٍ احتماليّ باتساع حَمْس كلمات وبين سياق 
احتمالي باتساع نحو أربعين كلمة (أو حتى نحو عشرين كلمة). 
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هذه الطبعة إهداء من المركز 
ولا يسمح بنشرها ورقيا أو تداولها تجاريا 
:ا ييا 


الحالة يُكْتَمَى بتعيين الحقول الدّلالية للكلمات في المستويات العْلْيًا (العامة) من شجرة 
التتصنيف الدَّلالي والعد ست البحث في غابة المستويات الدنيا (التفصيلية) من 
هذا التصنيف مما يؤدي في المحصلة إلى التخفيف من درجة الالتباس الذّلالبي ومن نَم 
تقليل فرص الخطأ في عملية إزالته؛ ويوضّح الجدول رقم )١-5(‏ أدناه بعض الأمثلة 


على ذلك: 
1 الكلمة حقوها الدّلالية التشصيلية حقوها الدّلالية العائّة |] 
مجن (تحَلٌ الصلاة» مكان أو مبنى مخصّص للصلا 0 (مكان الصلاة) 
5 إدراسة العبوب والحسنات». المال» اماع إدراسة العيوب 
المال» أوراق مخصوصة للبيع والشراء] والحسنات» المال) 
205 (ما يؤكل من طعام» مكان مخصّص لتناول 5 
مَطْعَم العام (تناول الطعام) 
يحُْنَى (الرهبة» الخوف. التوجّس والقلق) (الخوف) 


الجدول ه-١:‏ أمثلة على الحقول الدّلالية التفصيلية والعامة لبعض الكلمات العربية. 

ه, *- الاستفادة في تطبيقاتِ مثل يه المعلومات») (126100طع1مكص]آ1 
661 ) من الجسم النَّضَّيّ محل البحث كمُرَشّح («فلَرَ ]811)») للدّلالات المعجمية 
لكلمات «طلب البحث) (/01061©) وذلك قبل حرا عملية فك الالتباس الدلالي لما ؟ 

عيف 1ك بيدا بعضي الحقولٍ الدّلالية الممكنة هذه الكلمات في شبكة الدٌلالات 
للجمية ما لا يتوافر له نظي بشكل مترابط في ذلك الجسم النصيء نما يخفف من درجة 
الالتباس الدّلاي وهو ما يؤدّي بدوره إلى رَفع دِقةٍ عملية فك الالتباس الدَّلالي التي تلي 
ذلك الاستبعاد. 

ويبقى بطبيعة الحال جانبٌ كبيدٌ من التطبيقات الأخرى المامة (ما سنأتي على ذكْره 
في القسم التالي من هذا الفصل) تحتاح للتعامل مع الفضاء اللغوي باتساع نطاقاته 0 
ختلّف الأبعاد ولذلك فإن ارتفاع معدّل الخطأ في عملية فك الالتباس الدّلالي ينعكس 
على فعالية تلك التطبيقات التي لا مَفَرّ أمامّها سوى الانتظار حتى تنضج الأبحاث 
الجاريةٌ لمعالجة اللغة حاسوييًا على مستوياتٍ أعمقٌ تجمع بين توسيع شبكات الدّلالات 
المعجمية بإضافة مكوّناتٍ مناظرة لبعض العناصر الأنطولوجية الديناميكية (ما جاء في 
القسم الأول في هذا الفصل) إضافة إلى تحليل التركيب النحوي العميق للنص [11] 


ده ولاب 


وكل هذا بالطبع في إطار من أساليب التعلّم الحاسوبية» وهذا ما ستأتي على ذْكْرِهِ في 
القسم الثامن من هذا الفصل. 


*- تطبيقات التحليل الدّلائي الممْجَمِي 

بل ترام اوناك ارا ول كمي سدع إن ال مول سيرم 
«الترابط الدّلالي) الذي : 0 عليه العديدٌ من هذه التطبيقات؛ حيث ثُة 0 «المسافة 
الدّلاليّة» بين كلمتين بأقل عدد من «الوّصَّلات» (5علهذ.آ) بين الحقلين الدَّلاليين اللَّذَيْن 
تنتمي إليهما كلتا الكلمتين في «التصنيف الدلالي الهرمي» (/إ1800010): وقد يُدْخْلٌ 
0 الباحثين أحيانًا في حساب هذه المسافة الدّلالية أوزانًا شنية هذه الوضللات تيد 
شينًا ما مع الاقتراب من قِمَّة هرم التصنيف وتقل شينًا ما مع الاتجاه نحو قاعدته» 
ويتناسب «الترابظٌ الدّلاني» بين كلمتين تناسبًا عكسيًا مع المسافة الدّلالية بينهما. 


وبمعرفة ذلك يُمْكِنْنا إلقاءٌ الضوء فيها يلي على أمثلةٍ هامةٍ لتطبيقات مُعاكَّة اللغة 
حاسوبيًا التي ترتكزٌ على التحليل الدّلايّ المعجميّ: 


.ُ 


المساعدّة في اختيار التحليل النحوي (الإعراب) السليم من بين الاحتمالات 
الغزيرة التي عادةً ما تنوالدٌ عند محاولة إجراء التحليل النحوي حاسويّاه وذلك 
ما َطرحُه امول الشائعة «الإعراتث 2 المعنى») التي تختصرٌ الارتباط العضويّ 
يشاك من الدّلالة المقصودة للنص وتركيبها النحوي الصحيح؛ فإذا دَرَسَنا 
على سبيل المثال النّصّ التاللي ... وفي الوقت الذي تعاني فيه اقتصادات البلدان 
الأفريقية من مشكلات ...2 للمفاضلة بين إعرايْ كلمة «الأفريقية» إما نعنًا 
مرفوعا لكلمة «اقتصادات» أو نعنًا مجرورًا لكلمة «البلدان»» فقد تَرْجَحَ كفةٌ 
الإعراب الثاني بسبب تفوّق الارتباط الدّلاي المعجمي بين كلمتّي «البلدان» و 
«الأفريقية» (حيث قد تندرج مفرداتٌ مثل ان 1 5 حقل دلالي 
من قَبيل «وحدة ججغْرافية أو سياسية» بين| قد تندرج مفرداتٌ مثل (أفريقياء 
أفريقية ...1 تحت حقل دلالي قريب منه من قَبيل «منطقة جغرافية») تَمَوُقَا 
ملحوظًا على الارتباط الدُّلالي الأضعف بين لشترآ الذلكل الذى عع اله 
كلمة «اقتصادات» وذلك الذي تنتمي إليه كلمة «الأفريقية». ١‏ 
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هذه الطبعة إهداء من المركز 
ولا يسمح بنشرها ورقيا أو تداولها تجاريا 
ا:6ة6ا ب ييا 


ب. المساعدة أيضًا في اختيار التحليل الصرني الصحيح من بين الاحتمالات العديدة 
التي عادَةً ما تتولدٌ عند محاولة إجراء التحليل الصرفي الحاسوبي لكلمة ما؛ فإذا 
مَرَسْنا مثلاً كلمة «بطين» في النص التالي «... فيتدفق الدم في البطين الأيمن 
من القلب ...2 فإن الحقول الدّلاليةَ التي تقع تحتّها الكلماتٌ الواقعة في سياقها 
النصي القريب مثل مثل «الدّمُ) ل «القأب» ذاث ارتباطاتٍ دلالية أقوى - الحقل 
الدّلالي الذي يقع تحنّه التحليل الصف «بَطَيْن» (على صيغة التصغير فَعَيْل) من 
تلك الارتباطاتٍ الدّلالِية مع بقية التحليلات الصرفية المحتملة الأخرى مثل 
التحليل ١بَطِين»‏ (على صيغة المبالغة فَعِيل) ومثل التحليل «بطين» (كمُرَكبٍ جار 
ومجرور: ب + طين) ... إلخ؛ وعلى ذلك يَرْجحُ التحليل الصرفي بين 
على غيره من التحليلات الصرفية القياسية المحتملة الأخرى لكلمة «بطين». 

أ. وبنفس منطق التطبيقين السابقين فإن دراسة الارتباطات الذّلالية المعبّمية بين 
كلمات النص الناتج عن تقنيات التعرف الآلي؛ مثل «التعرف الآلي على الكلام 
المنطوق» أو «القراء الآلية للنص المكتوب» ... إلخ, لها قيمة ثمينة في تقدير 
مدى صحة عْرّجات هذه التقنيات حيث تَكْمُن الفكرة في أن تَباويَ متوسط 
قيمة الارتباط الدّلالي لإحدى الكلمات بها يجاورُها من كلمات في سياقها النصي 
تحت المتوسط العام لقيمة هذا الارتباط بشكل كبير قد يؤشّر 0 
على هذه الكلمة؛ فالعينة النصية التالية على سبيل المثال والتى قد 
نظامٌ للتعرف الآلي على الكلام المكتوب «... 3 لمبدع 
بإسهاماته الابتكارية في المجتمعات الحديثة ...) تحتوي على كلمة «القرد) ذات 
الترابط الدّلابي الضعيف مع باقي كلمات هذه العينة النصية مما يثير الرّيبةَ في 
صحة التعرف عليها ومن ثم الرجوع إلى نظام التعرف الآلي مرة أخرى للبحث 
عن بديل آخر ذي ترابط دلاللي قوي با حوله ربا يكون كلمة «الفرد» في المثال 
السابق. 

ج. يُمْكِنٌ أيضًا تطبيقٌ نفس المنهج لمراجعة رجات أنظمة الترجمة الآلية» وبصفةٍ 
عامة فإن تضمينَ دراسة الارتباط الدّلالي المعجّمي داخل آليات البحث 
والمفاضّلة الاحتتالية بين الوحدات اللغوية الممكنة أثناء توليد النص «المتعرّف 


لانو لانت 


عليه أو المترجّم) في كُلّ من هذه الأنظمة يكون أكثر فعالية من استخدامها 

كمرحلة مراجعة نبائية بعد توليد ذلك النص» حيث يسمحٌ هذا التضمينٌ 

باستدعاء بدائل أخرى إلى أن يتحققٌ تعظيمُ متوسط الترابط الدلالي بين كلمات 

النص المترجّم أو المتعرّف عليه ... إلخ. 

ه. يمكن لأنظمة «التدقيق و التصحيح الإملائي ») (لطة عمكاععطنت [اعمم 
0 أن تستفيد كذلك من دراسة الارتباط الدّلالي بنفس الطريقة 
لتعيين الكلمات المشتبّه في خطئها رغم سلامتها هجائيًا حيث قد يتعذر اكتشاف 
مثل هذا النوع من الأخطاء بأية وسيلة أخرى. 

و. تحسين أداء أنظمة «استرجاع المعلومات النصية» (28]100مكمط )بره 
1631 2) با فيها وظائف البحث النصىء وذلك عبر فهرسة الأوعية النصية 
تل البحث بالدّلالات المعْجّمية لكلماتها بدلاً من فهرستها بالمركبات الصرفية 
لهذه الكلمات من جذور أو جذوع”". ويرجع هذا التحسن إلى أن الفهرسة 
بالدّلالات المعْجمية قد ترفع كلا المؤشّرِين اللدّيْن يقاس بها أداءٌ مثل هذه 
الأنظمة وهما: 

0 الاستدعاء» (0)160211؟ حيث تعمل العلاقات الدّلالية وخصوصًا 
علاقة الترادف على زيادة القدرة على استدعاء الكلمات المشابهة دِلاليًا لكلمات 
طلب البحث حتى لو لم يكن بينها علاقةٌ صرفية؛ فعلى سبيل المثال إذا وردت 
كلمةٌ «الأسد» في طلب البحث فإننا 0 نتيجة الفهرسة الذلالية على 
كلماتٍ من قَبيل (اللَيْثْء العَصَئْمرء اينم ...1 (إضافةً بالطبع إلى «الأسد» 
ومشتقاتها) ما قد يَرِدُ في الأوعية النصية محل البحثء وهذا بالتأكيد يتجاوزٌ 
وامعفي ضلية شيعة] امورب لسر ا دعا 


-١‏ وذلك كما ورد في الفقرة أ من القسم السادس من فصل «التحليل الصرفي الآلي لمفردات اللغة العربية» في هذا 
الكتاب. 

١؟-‏ يعرف «مؤشر الاستدعاء» كميًا بالإشارة إلى «(طلب بحثْ» ما في قاعدة بيانات على أنه خارج قسمة «عدد المعلومات 
المستدعاة - ضمن كامل فئة المعلومات المستدعاة - التى تعتر استجاباتٍ صحيحةً لطلب البحث» على «عدد كل 
المعلومات التي تعتبر استجابات صحيحة لطلب البحث في كامل قاعدة البيانات محل البحث». 


اا 


هذه الطبعة إهداء من المركز 
ولا يسمح بنشرها ورقيا أو تداولها تجاريا 
:ا ييا 


2 
3 


0 «مؤشّر الدّقّة) (150وزءء:12)5١)‏ حيث يجري استبعادٌ الكلمات البعيدة دلا 
عن كلمات طلب البحث حتى مع وجود تشابه بنائي (صرفي)؛ فعلى سبيل 
المثال إذا وردت كلمةٌ اعَيْنَ) في طلب البحث بمعنى «مصدر جوفي للمياه» 
فإن الفهرسة الدّلالية للأوعية النصية محل البحث تؤدي إلى استبعاد كلماتٍ 
متشابهة صرفيًا من قبيل (أْعيّنء عيون (بمعنى جواسيس». عَيْنِيّ ...1 مما 
قد يَرِدُ في هذه الأوعية» بينا تؤدي في الوقت نفسه إلى الحصول على كلماتٍ 
من قبيل [ تَبْع» جَذْوَل عيُون (بمعنى ينابيع)» بئرء ينابيع ...] مما قد يَّرِدُ في 
الأوعية النصية حل البحث. 
وعاغي أن توتوعل أن العطليل الذلكل اللمكمى ختطوة أول تأسيسة تبهو 
المعاطة الذلالية العميقة و اللمفدة أن كانك المقاربات الشخدمة فيها: 
وفي حين أن القائمة السابقة قد تتسع للمزيد من تطبيقات التحليل الدّلالي المعجّمي» 
فإن الملمح الواضح المشترك بينها هو احتياجها جميعًا لدرجة مقبولة من الدقة في فك 
الالتباس الدّلالي المعْجَمي وهو التحدي الذي لم تتغلب عليه أساليبٌ المعالجة الحاسوبية 


0 


-١‏ يعرف «مؤشر الدقة» كما بالإشارة إلى «طلب بحثْ» ما في قاعدة بيانات على أنه خارج قسمة «عدد المعلومات 
المستدعاة - ضمن كامل فئة المعلومات المستدعاة - التى تعتبر استجاباتِ صحيحةً لطلب البحث» على «عدد كل 
المعلومات المستدعاة في فئة المعلومات المستدعاة». 


ع ولاب 


-٠‏ العَُونة الدّلالية الممْجَمِية للمدوَّنات النصية العربية 


| 2 - 1 غ: 21 ع ع كد | لفاس الورقيم لوع المورظهم 

5ه سياه نوم وه ١‏ اس . 

لترجحمة وسيياة اسعاميية. لوال محتسارانثك بين شُمُوب عَلَى ل اْمُصُور م رار وِلِدُور حَول: 2 
حبي خي المي طلر 4 17 


مُصِدّفة منتظمة | مصرفة متانكلمة ىل تقة سس ] نافمة مُصرّفة منتظمة 


الفرار] ! 831 


الشّكل ه-١‏ : لقطة من أداة عنونة النص العربي صوتيًا وصرفيا ودلاليِ «قُصيح70 ويلاحظ أن 
اختيار الحقل الدّلاِي الأنسب للكلمة ١‏ مَرّا يجري بعد حسم تحليلها الصرني. 

يوجد الالتباس اللاي المعجّمي كأمر رِ واقع في آية شبكة دلالاتٍ مُعجّمية» وتحتاح 
تطبيقاتٌ التحليل الدّلاني المعجّمي كما ورد في القسم السابق من هذا الفصل إلى فك 
هذا الالتباس» ولاغنى في الوقت الراهن عن الاستعانة بأساليب التعلّم الحاسوبي لفك 
هذا الالتباس» وتحتاج شل هذه الأساليب بدورها إلى موارد لغوية كي تتدرب عليها 
وكزن قكالالاك ن|ذبَها الاحتمالية الرياضية» وتتكوّن هذه المواردٌ في حالتنا هذه من 
نصوص حَدَدُ لكل كلمة فيها الحقلٌ الدّلالي (أو فئةٌ الترادف) الأنسب اء ويُسَنَّى 
يي هذه الموارد بعملية «العنونة الدّلالية المعجّمية» للمدوّنات النصية التى ينطبق 
عليها ما ورد في القسم التاسع من باب «التحليل الصرفي الآلي للمفردات العربية» في 
هذا الكتاب. وبالإضافة إلى ذلك ينبغي الانتباه إلى النقاط التالية: 


-١‏ تحتوي الورقة المشار إليها برقم ]١5[‏ في قائمة مراجع هذا الكتاب على تفاصيل هذه الأداة التفاعلية. 


هوا - 


هذه الطبعة إهداء من المركز 
ولا يسمح بنشرها ورقيا أو تداولها تجاريا 
:ا ييا 


* لا تجري عملية العنونة الدّلالية المعسجّمية إلا على نض جرى حسمٌ التحليل الصرفي 
لكلماته (وتحددت أيضًا «أنواعها الكلامية 1888 2058)» )» ويعرض الشكل رقم 1 أعلاه 
لقطة أثناء تشغيل إحدى أدوات عنونة النصوص العربية التي تدعمٌ كل هذه العَنْوّنات. 

* يقوم اللغويون المؤمّلون بهذه العنونة الدّلالية المعجّمية للنصوصء وأحد المؤهلات 
المطلوبة هي الإلمامُ بقدر معقول من المعرفة عن موضوع المدوَّنةٍ المطلوب عنونتها. 

* يوجَدُ هامش اختلافٍ طبيعي بين اللغويين القائمين بالعنونة الدّلالية أو بتقويم أداء أي 
لك 
الأخدٌ بالرأي الغالب لفريق يتكون من عددٍ فردي من المعنونين. 


8- التحليل الدّلائي ما بعد المستوى المحجَمَىي 

كما ألمحنا في نهاية القسم الخامس من هذا الفصلء فإن الأعمال البحثية جاريةٌ لمعالحة 
اللغة دلاليا فيا يتجاوز المستوى المعجّمي وهي تتوجه عمومًا نحو الجمع بين توسيع 
شبكات الدّلالات المعجّمية بإضافة مكوّناتٍ مناظِرةٍ لبعض العناصر الأنطولوجية 
الديناميكية (ما جاء في القسم الأول في هذا الفصل) وتحليلٍ التركيب النحوي العميق 
للنص» ات في إطارٍ من أساليب التعلم الحاسوبية [17]. 

ولا تقتصرٌ أهمية دراسة التحليل الدّلاي العميق على السعي نحو تحقيق الأهداف 
الأستراتسة اشر لسيرة اللناقة الخامنوية للخات اليةى| مكتيهن انتادك الآلات 
لناصية اللغة فههًا وتوليدًا بمستوى يقترب (ولو جزتيًا) من المستوى البشري”"» بل إن 
هذه الأهميةً مُلِكَةٌ من منظور عَمِنٌ مَْحَنٌ كذلك من أجل رفع أداء العديد والعديد من 
التطبيقات الأساسية المرتكزة على التحليل الدّلائي المعُجَمي (من مثل تلك المذكورة في 
القسم السادس من هذا الفصل) إلى مستوى يثبّتها في مصاف التقنيات الحاسوبية التي 


ووم عي 


يعتمدك عليها. 


-١‏ وإِنْ تحققت مثل تلك القدراثٌ اللغوية للآلات فإنها سوف تتفوق على البشر بكونها تتوفر على قدراتٍ هائلة لُبِائَّرةٍ 
ومُعاجَةٍ أوعية شاسعةٍ الاتساع باذخة الغِنى من المعلومات والمعرفة. 


ع وطلاب 


وضمن هذا الإطار تقع «لغةٌ الشبكات الدّلالية الحاسوبية 
العالمليبة) (22811286.آ 7161501128 61591 1[017) - التى 3 أيضًا بالاختصار 
(021) - في موقع رياد بين جهود الحوسبة الدّلالية ِل فيها يتجاورٌ المستوى 
المشكمئ [15]: وم لقة جاسوية كيه مصنكية خقيضًا فل النيانات الدّلالة 
لكايه ون تصومى اللقاك نيه رركن طني كلقع رتكا روز للم الفرعة 
الآلية بين أزواج اللغات المختلفة» وكذلك كلْعْةٍ للتمثيل المعرفي العام تستفيدُ منها على 
سبيل المثال أنظمة استرجاع المعلومات. 

وقد نشأت هذه اللغة عام 447١م‏ في معهد الدراسات المتقدمة بجامعة الأمم المتحدة 
في «طوكيو باليابان» وتم النشرٌ عنها لأول مرة عام 19149١م,‏ ويَسْتَمِرٌ رن مل 
ذلك المحين عبر شبكة عالمية واسعةٍ النطاق من الباحثين والمطوّرين» كم أنْشِمَتْ شِكَّثتْ لذلك 
مؤسّسةٌ غيدُ هادفةٍ للربح تحت اسم 102/21) وهي مُشْهَرة ي اتعزيف بسؤيسراه في 
عام ١١٠٠م‏ للقيام على هذا المشروع العملاق؛ وتعلن هذه المؤسسة أن هذا العمل ملك 
للأمم المتحدة ما يعني أنه ملك لعموم البشرية. 

وُعَدٌ «لغةٌ الشبكات الدّلالية الحاسوبية العالمية» مثالاًعميقًا ومفضّلاً في اتجاه التمثيل 
المعرني اللغوي البشري المشترك المستقل عن خصوصياتٍ كل لخةٍ حية» حيث جرى 
تصميمٌ طبقات ومكوّنات هذه اللغة بالتناظر مع العناصر الرئيسية في اللغة الحية من 
مفرّداتِ ونحو وأنطولوجيا ولكن بصورة حيادية". وقد أنجز هذا المشروعٌ العملانٌ 
ينه الأساسية عبر السنين الماضية بواسطة جهود مئتي باحث مُكَرّس لذلك فضلاً عن 
الآلاف غيرهم عق ساغدرة وتشروة حول هذا المشروع عبر أاة الأرضء وما 
زال المشروع قاتً) على تحسين هذه البنية التحتية كما لا يزال يواصل إنجاز الجسور بين 
اللغات الحية الكبرى (ومنها العربية) إلى هذه اللغة الحيادية. 

ولاتزال هناك تحديات أساسية تواجه هذا المشروع؛ منها على سبيل المثال الالتباس 
الكبير على عدة مستويات لغوية أثناء النقل من أية لَعْةٍ حيةٍ إلى لغة الشبكات الدلالية 
الحاسوبية العالمية (الحيادية)» ومنها أيضًا قصورٌ قدرات هذه اللغة الحيادية عن التعبير 
بشكل كامل عن الدَّلالات والمقصودات العميقة لعبارات النصوص في لغاتها الأصلية! 


-١‏ مع مراعاة استبعاد عناصر الالتباس الكامنة في اللغات الحية من هذه التصميمات. 


للا ةطب 


هذه الطبعة إهداء من المركز 
ولا يسمح بنشرها ورقيا أو تداولها تجاريا 
:ا ييا 


كما يقع في هذا الإطار مشروعٌ آخر تحت اسم 7 نُونّس) (و11016مغم0) 
[7"] لكنه على جانب بناء الموارد اللغوية اللازمة لتدريب الأنظمة «المزتقبة تقبة») للمعالحة 
الخاسوية الدّلالية العميقة للّخة الغية عي العنونة الدّلالية دالتحرية للعدوتات النضية 
غل فسشرى الثمل. :وقد انظلق. ١أولطو‏ توثينة خلال العام ١٠10م/1011م‏ 
وسيظل تحت التنفيذ الاخس سترانت وتقوم عليه شركة (بي-بي-إن» (882) 
مع جامعة كولورادو. وجامعة ينانا ومعهد علوم العلونات بجامعة جئنلوب 
كاليفورنياء وتقع كل هذه المؤسسات في الولايات المتحدة الأمريكية. 

ويستهدف المشروعٌ إِتامَ العنونة اليدوية لمدوّناتٍ نَصَّبَةٍ بالإنجليزية (مليون كلمة) 
وبالصينية (مليون كلمة) وبالعربية (نصف مليون كلمة)» وهي تغطي نطاقاتٍ متنوعة 


[أعان عاكات العوقة «دويكات الكنروية لوقن تمومادة ظرات اهانب 
خاضرات .:.) وذلك عبر عنونة ذاتٍ دقة عالية جدّا واتفاق يجاوز تسعين ف المثة ين 


والعيونة الممشيكفة هى عنونة تركبيةاتحويةدولذالية) غل سغرى الشكل الكادلة؛ 
ترتبط فيها المعلوماتٌ النحويةٌ (إعرابية + تراكيب «مُسْسّد - مُسْنّد إليه6) بالمعلومات 
اساي ام يه 
يُنْسَبٌ إليه المعنى). وسوف يتيحٌ المشروعٌ بعد إتمامه هذه المدونات المعنونة للباحثين 
بصورة مفتوحة المصدر من أجل تشجيعهم على تطبيق وارِزمات التعلّم الحاسوي 
عليها سعيًا إلى تدريبها على تحليل وإنتاج هذه الارتباطات والتراكيب حاسوبيًا في وثائق 
جديدة خلاف تلك التي أنتجها هذا المشروع. 


-7.4- 


ل ل لي رد 


سا العامة 
اه 323230000008 
تكريس العديد من مثل هؤلاء الباحثين لجهودٍ غزيرة على مدى طويل من أجل: 
الاتفاق أولا عل الصياغات الرياضية المحكمة للمسائل الدلالية المركزية على المستويات 
فوق المعجمية» ثم إيجادٍ حلول رياضية مقبولة لهاء ثم ترويض التكلفة الحاسوبية لهذه 
الحلول حتى تصيرَ في متناول قدرات الحاسبات الرقمية المعاصرة ويمكنّ بذلك أخيرًا 


إدماجها في تطبيقاتٍ عملية ضمن إطار تقنيات معالحة اللغات الحية. 


العمل على العنونة الدلالية المعجمية - وكذلك العنونة الدلالية فوق المعجمية - لمدوَّناتِ 
نصيةٍ متوازنة النطاقات وذات أحجام كبيرة وبدقة عالية» وهو أمر تمس ال حاجة إليه من 
أجل تدريب مختلف آليات فك الالتباس الدلالي. 


ببليوجرافيا مرجعيّة 


ع 


أنيس (إبراهيم): دلالة الألفاظ» مكتبة الأنجلو المصرية» 1957١م.‏ 


جبل (عبد الكريم حسن): في علم الدلالة» دار المعرفة الجامعية» الإسكندرية» 
/11. 
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الفصل السَّادس 
التحليل المعجميّ الآليّ 


335 المُعترٌ بالله السّعيد 


-١‏ في التُحليل المعجميّ. 

؟- من مُكوّنات ال معجم الحو 

المُعاكَة المعجميّة الآليّة في مراحل الصّناعة. 

4 - من أدوات العا الآليّة لمكوّنات المعجم اللو 

© - أفكارٌ بحثيّة لأطرّوحات علميّةِ ودراسات مُستقبليّة. 
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للالطراسي 
يُعنى التُحليلٌ المُعجميٌٍ بمُعاجَة ُكوّنات ت المُعجو اللّويَ الي تنبئقٌ عن كتين 
يسَينء هُما: المبنى» والمعنى. ومن هذا المُنطَلّقء فإِنَ التَحليلَ المُعجميّ يتناول 
سيب البحث ف ارال لغ الإنسئة» وق جع قرحت اله لصيف 
وترتيبها وتعيين صِيَغِها ومُشتقاتها ومعانيها وأساليبهاء بالإضافة إلى شواهدها الدَالَة 
غل اتش لخب اللخوية. 

ا ل ا ال لين 
المعارف ل (من العاي: والشّواهد والاستعالات. ...)؛ وَيعَبّرُ عنة في الصّناعة 
اد الحديثة با رف ب (لكسيم عع ل أو 0 العف 6 أو (وَحدة 
التحليل المتحمة) . وفي اللّغات الاشتقاقية أمثل اللّخة العريّة| 7 تتفرّعٌ الوّحدةٌ المعجميّة 

عن أصلٍ [أو جذر] للكلمة. يُعرَفْ ب (المدخل المعجميّ)» ويُمكنٌ تعريفة بأنّهُ الحقل 
الذي تسّمي إليه مجموعةٌ من الكلمات التي 7 تشتر كك اذه لكو ا واسدة شر فصي 
ذلك لاحن 


ما ا 0 ل 0 0 أبنايا لأجل الوصول إليه؛ 
بذلكَ وسيلة إزالة التباس اد ويُعتَمَدُ في استنباط المعاني الْجمية على الدّلالات 
ةلدات اللّغة في السّياقات الّتي ترد فيها؛ وتبعًا لذلكَ» يمتَمَلُ أن تتعدّ لمعان 
ا محجميّة للمُفرَ اراح لصي يي . وبطبيعة الحال» إن هذه الشباقات عد 


2 
3 


را الطيدة المتفدنة دنا 


الخليل المحم إذن تتكرنات الحجم اللّغْويٌ الي تبدأ بالمداخل؛ وتتفرّح 
عن كلّ مدخ وَحدة أو مجموعةً من الوحدات الممجمية؛ ويتفرّعٌ عن كل وَحدةٍ معنّى 
أو مموعة من عاق المحقمةووحمل كن فس معان رظي يه ويّصلُ كل معنّى 
بشواهدٌ ومعارفٌ مُعجميّة أخرى, وهكذا #وسقرض ليان هذه المكونات ودوؤفائق 


المحجم اللّْويٌ فيها يأتي. 


- #5١8 


هذه الطبعة إهداء من المركز 
ولا يسمح بنشرها ورقيا أو تداولها تجاريا 
:ا ب الل ييا 


ضع لمجم لوي لعنة عوايل» منها طبيعة اللخةه والعَرضُ من الحجم 
والفتاثٌ امُستهدّفة. لهذاء فإنَّ المعاجم اللّخوية تأخدٌ أنماطًا مُتلفة. وبطبيعة ال حال فإنَ 
هذا الاختلاف د يُؤدّي إلى 3 مُكوّنات لمجم [أو عناصره]. وقل سيل انثات»م فإنٌ 
المعاجم المعاصرة لا تُعنى بمعلومات التّأثل التي تعد كوا رئيًا في المعاجم التَارِيخِية 
والمعاجمٌ المُوجّهة لأبناء الّغة الميّنة لا يُعنى بمعلومات التكرار التي تُعنى بها المعاجمٌ 
ليمي ارك مايه اللّغق وقس على ذلك أنواعَ المعاجم باختلااف 


كن القول إن نال كرات العم ا كييك لزاه وما 
يكون مُعجً بالمفهوم الدّقيق ل بؤٌجودهاء مثل: (الوحدات الحية التي تعر 1 
«اللّخة الموصوفة)؛ وهي لمعل في الرّدات [الغامضة] التي يشْدُ صُنَع المحجم م 
وإزالَة الالتباس عنهاء وكذلك المعاني الحعد ” لعي تعَب تعن «اللخة الواصفة»؛ وهي 
هاده الإفهام الي تؤدّي حناحة مُستخدمي المحجم ل المهدفٌ الأساسيّ من الصّناعة 
المعجمية. 


من هذا المنطّلق» يمكنٌ تصنيف مُكوّنات المعجم وفقٌ اعتبارين: 
- اعتبار العُمُوم والاختصاص: 
عي 7 تصلح 9-6 امكو نات لآن تكون عنص | ف حيلف أنواع المعاجم. 


عم 


ار م وسار 1 خنّضَّةِ مصنوعة لأهدافٍ 
- اعتبار التَّبات والتَّغرٌ : 
ونعني أن تأمْحد؛ م بعض المكوّنات شكلًا ثاب تفرضٌه قواعدٌ اللّخة وقوانيُهاء وأن 


تخد تكؤنات اعرف دكا :1 ديرا صحكم فيه الل المعجمية ذاتها. 


ل ل سس 
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عو 5 2 
١‏ مُكرّنات المحجم اللو 2 0 6 عمد -- 0 
عامّة مختصة ابتة متغيرة 
١‏ لداعل والو كات اليد 0 0 
' معلومات الحجاء والنْطق + . 
0 المعاني الوظيفيّة + 5 
5 المحاق عدي + + 
0 المعلومات التَأثِيلية + + 
1 الحُقَول والعلاقات الدّلاليّة 1 م 
5 الوا ال + . 
1 المعلومات التَّار يخيّة + 3 
4 مُستويات الاستعمال + 5 
1 معلومات التّكرار [الثَرَدُد] 0 + 


الجحدول ١-5‏ : نماذج من الوحدات المعجمية في المُعجم العربيّ 
ونعرضٌ فيا يأي لماهيّة هذه الكوّنات: كُلّ على جدة» مع التّمثِيل عليها في مجم العربّ. 
و يت 
؟ و١‏ -المداخل والوحدات المعجمية (وعسرعدع.آ ع وعنسسك) 


المدخل الحسجَحِي اتتخمظ لوعلء.] هو ذلك الحقل الْني تنّمي إليه مجموعة وخ 
الكلمات التي : 7 تشترك في ماده لعي واجدة [ني معاجم الألفاظ]ء وقد يكون جذرالُعَويا 
لكلمة عَرَبِيّةِ أو معرب أوتمكون طاذة تعجر [خدير ل نمه متها وفك لصيل ] كاه 
دخيلة؛ 5 الوحدات ال 9 فهى جوع الكلمات الرَأْسِية الى تشَكلْ 
القَوائِمَالسَدِلَة عن اكدخل. ْ 


ويُوضٌحُ (الجدول 5-5) ناذجّ المداخل والوحدات في المعجم العري. 
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١ م | الوحدات الُعجميّة | المداخل الحجميّة | أقسامالكلام | أنواع الوّحدات‎ ١ 
آثر فعل عربيّة‎ ١ 
7 استائر 5 عل‎ | ١ 
الأثر اسم عربيّة‎ 0: 
الباشا باش ا | دخيلة‎ 3 

خيس 2 2 وه 
6 الاسقف 57 اسم معر 

شفا 0 
7 كَنَبَ فعل عربيّة 
4 الكاتب تب اسم عربيّة 
0 المكتبة اسم عربية 
06 5 يا حرف / أداة عربية 


الجدول 5-:: نماذج من الوحدات المعجميّة في المُعجم العرّ 


؟",7- معلومات الطحاء والنُطق (م60 2ع مسصوط »> اءطقطملام) 

يُقصَُ بها امعلوماث التي تُوجُ ُستخدمي المعجم إلى معرفة طريقة كتبة الوحدات 
المححمية [أو الكدات المفر وس وكيفية ُطقها بصورةٍ ميك وفقّا لقواعد اللّغة. 
ودف 0 هذه المعلومات تعليمي, ف الأساس؛ حيث تُساعدٌ مُتعلّمي اللّعة على 
الإفادة من المحجم ف 3 الؤارات اللهرةة اراد والكعارةه والتحدث والاستماع. 

فيها يتعلّقُ بمعلومات الهجاء, تُلاحظٌ عنايةً المعاجم العربيّة القديمة بها؛ حيثُ كانت 
نْصٌ على أنَّ كلمةٌ ما تُكيّبُ بالعين المهملة تييرًا لها عن العَينء وأنَّ كلمةٌ انيه تكيّبُ 
بالباء المحَدة مالا عن الياء» وأنَ كلمةً ثالثة نمب بالتَّا ناه تمبرالها عن النَاء حي 
نُوصَف بأَا مُئلئق» وهكذا . ومع تطوّر شكل الكتابة العربيّة بي وظهور التّقاط وعلامات 
الصضّبط» اميف هذه العناية» حتّى تلاشّت في أكثر المعاجم المعاضيرة: 

ا معلوماتٌ النطقء فيعلْبُ على المعاجم العربيّة أن تكتفي بوضع علامات الصّبط 
لفبنة عن النطق السّليم؟ اننم بعض ا معاجم التي تعنى بابراز طريقة نطق الوحدات 
الف باستخدام رموز الأليفبائية الصَونيّة 3 الذوية عتأعممطاط 10201 متعام1 
104) )هطق تاماخ )؛ وهي دوعا بن لمرو لساري نكن قوير الضوة ادر 
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بباريس ال عنو لاغ مط 550612105 في ور ييل م لتيسير قراءة 


بتكف اللّغات الإنسانيّة 
للفونيات [الأصوات] العربيّة. 
١‏ الصَّوت | الرّمز الصَّوت | الرّمز 
وأسقصطوكصهن) تدك عى واسقسمكمه0 الصَّو امت وأشباه 
ع 7 3 4 
تت 1 س 5 
ثْ 1 ش 5 
جَ 03 ص 5 
حَ 1 طّ ا 
د زهو ظْ 7 
د 94 ع 9 
3 8 
10 الصّوائت 
[(4 قصيرة مر رو قصيرة رق 
)١(‏ طويلة ا (و) طويلة :1 


؟ م المعانني الو ظيفيّة (مصمناعصد1 لدع اأمسسدمق) 


ىا 


5 


(ي) قصيرة 
(ي) طويلة 


اللتذوق نما تصوو لد موة الكداية الشركة الوعدانت ابد العرة 


3 ويُوضحٌ (الحدول 1 كرهة د لرُموز الكتابة الصوتيّة 


١ الرّمز‎ 


| كراج احم 


يُقصَدُ بها الوظائف النّحويّة التي تُؤدَيها مُفردات المعجم في سياقات لُخويّة تتجاوز 
إطاة اكلم الواسحدة إل زر اكرب و انض الاق لغوكة: وتقتصرٌ المعاجمٌ اللغويةُ عمومًا 
على المعاني الوظيفيّة السّاعيّة دونَ القياسيّة. وتأتي المعاني الوظيفيةُ في الُعجم العريّ على 
إحدى صَورَتّين: 
- (المعاني الوظيفيّة البتويّة يَ). تُعنى بالبنية الصَّرفيَّة للمُفرّدات؛ ومن أمثلتها: ما 
يتصلٌ بأبواب الأفعال الثُلائية جردو ومصادرّهاء وصِيّغْ التذكير والتّأنيث» 


وجموع التّكسير. 


194- 


ا 


هذه الطبعة إهداء من المركز 
ولا يسمح بنشرها ورقيا أو تداولها تجاريا 
:ا ييا 


- «المعاني الوظيفيّة الث كيبيّة). تُعنى بالبنية الَرَكيبيّة؛ ومن أمثلتها: التّمييز بينَ أقسام 
الكلام العري (الاسم والفعل والأداة)» والتَّمييزبينَ اللّازم واتعلو يو لانمل 
والذّاعي إلى وُجود هذه المعاني في المعجم أئهَا لا تخضعٌ لقاعدة نحوية ؛ معينةٍ يُمكن 
الاهتداءٌ بها أو القياسٌ عليهاء وليسّت مم تُعنى به مصادرٌ التّقعيد النّحويّ للخة. 0 
نَّ تبدو الحاجة إليها لجاعدة مُستخدمي المحجم على توظيف المْمَرَّدات واشتقاقاتها في 
استعمالاتٍ لُْويّة سليمة . وعلى سبيل المثال» تُساعد المعاني الوظيفيّة البنويّة على توجيه 
مُستخدمي المحجم إلى صيغة ة الفعل الُضارع (يكثب) من الماضي الثلاني جرد (كَتَبَ)؛ 
و تُساعدٌ المعاني الوظيفيّة الأركية عل ترجا اللعقدوة إلى أن القعل (اعط ) ل 
يستقيمٌ في الجُملة العربيّة إِلّا بوُجود المفعولّين, بمعنى أَنَّهُ فعلٌ مُتعدٌ بمفعُولَين؛ وهكذا. 


"'.,5م- امعان المعية سن لوعتدع.آ) 
المعتى المعجمنٌ هو العامل المشترك بين العجزات اللكركة عل مادق انواعياة اذ 
يُعَوّلُ عليه أساسًا في تحقيق غاية هذه المحجرات من الإفهام وإزالة العُمُوض؛ ؛ ويُقصَدٌ 
به ذلك المعتى الذى 3؛ ُشِيرُ إليه الوحداث المعجميّة في سياقاتها اللْغويّة» شريطة أن تكون 
هذه السّياقات مُعَيرَةٌ عن العرف العام لدى الجماعة احرف أو بعبارة أخرى, شريطة 
م 0 
اللّغويٌ | 
ويأق المعض المستعسىٌ غل إخدى صوركن: 
2 ا معنى الَقيقِي واستوعم لهننءغ.1: وهو المعنى الصّريح المماشر الذي تُشيد 5 بر إليه 
مدلولات الوحدات الحم 
ب ا معنى الْجازِيّ ع لتطوعمم ع كناو ع1 : وهو ا معد عون المماشر الذي مل 
دلالة مُعايرةً للمعنى الحقيقيّ؛ 00 هذا المعنى ذا طايع بلاغيٌ» وَتَدُلّ عليه 


2 لمعاني | 3 ا للوحدات [المْمرَدات] تَعَدّد السّياقات وأساليب التّعبير 
تي ترد فيها الرّدة. ويُمكنْ التَِّيلُ على ذلك بالوّحدة العجميّة (الَين)؛ حيثٌ ترةُ 


أحيانًا فتفيدٌ «عضو الإبصار عند الإنسان والحيوان»؛ وقد يراد مها لينبوع الماء الذي 


3-0-7 


عرق ف الأرع ل وترمي > جار - إل الجاسومن الرواق لطلة حبذ وال كين 
00 وإلى «ذات الشَّىء): وقد ترمى إلى مع جَازِيٌّ كر فيل «الوكرامَ والحفظ» 

تقول - عل سبيل الود والألفة (أنتَ على عَنِي)؛ وغيرها من المعاني التي تقَضّحْ 
م خلال السّياق. فطل ولك د قي 0 الصو (الخاعين )لصت تشيرٌ إلى 
(الشَّعْر نابت فوقٌ ا و يضًا - إلى (خازن الباب وحارسه)؛ وكذلكَ 
0 (القانون) 9 شري 53 7 الوتريّة) وإلى (قَواعِدَ وأَحكام يَتَِعْها 


؟ وه -المعلومات التأثيليّة (م تح صندمكم]آ لدعزع هامس 2) 


يُعنى التأثيل المحجميّ وه الناوءك8| بتعيين المعلومات تي : تبحث ثُ في 
أصول الوحدات افده ف مرحلة ما قبل و صوص اللّخق - تع التَطوّر 


506 


اللخوي حاوف هذه الاصيول» حتى مرج الاسسش رارق لصون اللحة عق 


وقد اهن شنم الاجم بالثائيل المستجم ق'العلايد من اللحات الطبيعية مقل: 
الأمانيّة والإنجليزيّة والفرنسيّة. فصَنّعوا معاجم تخصوصة لذلك» عُرِفّت بالمعاجم 
التَأثِيليّة. ما في الّغة العربيّة» فقد ظهر الئل المحجمي في حقبهة زمييّهِ مُتأخرةٍ نسييّاء 
في بعض تجارب الصّناعة المعجميّة ع غير المكتملة» مثل «الحجم الكبير» الذي يعمل على 
إنجازه مجمع اللّغة العربيّة «اللعررو لقم الدوحة التَاريخيَ الذي يُشرفٌ عليه 
المركز العربيّ للأبحاث في الدّوحة. وتعتمدٌ مثل هذه المعاجم في تأثيل ارات على 
تعيين التُظائر المشابهة لمبنى الكلمة العربيّة ومعناها في اللّغات السَّاميّة أو لُغات بعض 
الفصائل اللّويّة الي كانت على صلةٍ باللّغات السَّامِية 


7 وكك- د لو العلاقات الل لاليّةَ (مدمنماع عنتسمدى؟ ع كللء1 عتاممدنة) 

يُقصَدٌ ره الدّلاليّة 11105 عنأصدصه5 المجالات الموضوعيّة [الدُلاليّة] الي 
تتبعُها مجموعة من المفرّدات النتمية إل خقل شعن مثل حقل (الملبّس) الذي يضم 
(البنطال» والخلبات؟ والعامة). وإذا كان لذ اللي [وما شاكلة 3 الأصول] ل 
صورة المدخل ا محجميّ ف تعاجم الألقاظ يكإن الحُقوِلَ الّلاليّة 15 أوعية المْمرّدات 
ف معاجع العان الو ضوعاتك] الى شنم قنتدات اللحة وثرها الطلاقا مرج المع : 
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هذه الطبعة إهداء من المركز 
ولا يسمح بنشرها ورقيا أو تداولها تجاريا 
:ا ييا 


أمّا العلاقاث الدّلالة كدمنهاء] اك فهي سه الرّبط بينَ الوحدات 
الح توتاق هله العلاقاث ف الج اللنوق عل إحدى شررتين! 


- العلاقات الأفقبّة: فقيّة: تكون بين مجموعة من المْرّدات تي تقح في مُستوى دلالي 
متواز؛ مثل علاقات (الراذقه والتَّناف والتَّضادٌ والاشتراك اللُفظىّ) 
- العلاقات الرّأسبّة ّه: تكونٌ بينَ مجموعة من الرّدات التي تق في مُستوى دلالي 
مُتتالٍ [عموديّ ]؛ مثل علاقات (الاشتالء والنُوعيّة بالكل والحزئية). 
ودر الإشارة إلى عناية المحجم العريٍ بالملوضوعات في وقتِ مُبكّر؛ حيث ظهرّت 
العديد .عن لقانت ا اعتَدّت بِالُقول والعلاقات الدَّلاليّة» مثل: (الغريب 
المصَتّف) اللقاسم ََ سلام (175ه)ءو (جواهر الألفاظ) لقدامة بخ بعر الا 
واافقه اللحة وي العريئة) تعد الللك ين مد التعالبي (898) فو (المخصض) لأبق 
سِيدّة الأندلِّيَ (/45ه)» وغيرها. 


اا الشَّو اهد المة (ععصع1110 لدعنمدع1) 

تمد الشَوَاهَدُ المسحميّة ولبلا عل وجوه استعال لخوي حقيقيٌ للوحدات المعجميّة 
ومعانيها؛ وتُتل بذلك إحدى وسائل شرح المعنى, لاسيًّا في الوحدات والمعان امعجميّة 
التي تحمل دلالاتٍ عير دائرة في الجَمَع اللغوي .وشهيذ التؤافة الحم ماكاق 
الغالب من (الددناتك اللخوية 222) مالواساع ما وهي مجموعات 0 سي يا من 
أشُوصض اللحة المكلةاللوائم لوي وامُستمدّة منه أساسًا . وفي بعض الأحيان؛ يلجأ 
0 مقامَ الشّواهد ا معجميّة. 

والواقعٌ أنّ اختيار الشّواهد المحجميّة لايم بصورةٍ عشوائيّة؛ إذ يبغي أن تتحققٌ معة 
غَايةٌ الإفهام وإزالة التباس المباني والمعاني. لهذاء ينبغي إخضاعٌ الشوافن المحيس البعقن 
الصّوابط المنهجيّة التي ته تضمنٌ تحقيقٌ الغاية . ومن هذه الضّوابط: على سبيل المثال : السّلامة 
اللركه والإمان و الز قوس وقيوع البنية ري للك اهدق الحم اللنوى. 


١‏ و 8- المعلومات تار بي (سم تاه سرمتم لمع ترم 5ز11) 
عنى المعلوماتُ اَي فيالمعاجم اللو تعب التوّرات الات الحادثة في 
لجا مدي لم ب 
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اللغة]؛ كيا تبحث ف المستعمل والمهمّل والمات من مُفرّدات اللغة غير تارحها: 


- 
ع 


والواقع أن التّعاطي مع هذه المعلومات ليس أمرًا يسيرا في المعاجم العرييّة؛ يت 
يفرضٌ تاريخ ال العريّة وجو قد كبر من الُونة عند التَأريخْ للوحدات المحجيية 
5-77 فبالإضافة إلى أن العرييّة ل ترح صُورتهاالمنطوقة لثات السّنينء فقد ضاع الكثير 
من تُرائْها امكتوب: لاسيًا الثَّرَاثُ المدَوّنَ في سني التَّدوينَ الأولى من عُمرها المديد. 

وتجدرٌ الإشارة إلى وجود علاقةٍ وطيدةٍ بين المعلومات ليخي والمعلومات اللي 
الي سَبَقت الإشارة إليها را نر وات نميا ااا يي 
بالأصل الني كانت عليه الكلمة» فالمعلومات التَاريخِية تُعنى بتعقب التَِّياتِ الحادثة على 
هذا الأصل عبر المراحل الزَّمنيّة لمتعاقبة للّة؛ ومن ثب فإِئَّا تحضمٌ لقوانين الور اللَّويّ. 


؟, 4- مستويات الاستعوال (واءلع.]آ ع6ع193]) 

وهي الُستويات الي تتحدّدُ من خلالها حالةٌ الوحدات المُعجميّة وف اعتباراتٍ 
و ل 0 منها على بعل المثال: اعتتبار ليوح والإهمال (شائع» مُطَّرد نادر» 
كناذ) واعتبار الإباحة والقطر (عقو مُتَدّل) سَُوقِيٌ» سَوادِيٌ) واعتبار المكان (مَدَيَ 
اسك سه عست سه وبطبيعة ا حال فإنَ 


1- معلوه مات التكر ار (ممتأقصسدمكمآ1 الي 

يه اوقتلا اناده 
إليها عند الحاجة إل التَأكّد من تَبُول المجتمع اللو رات معي أو رفضه ها . ولهذه 
المعلومات أَهيدٌ في صناعة المعاجم اللعليمة خصُوصًاء عيث ساعد تليق اللّغة 
على الاهتداء بسُهولةٍ إلى أكثر المقوداف دورأنا في اللّغة. والواقع أن استخلاصٌ هذه 
الملؤمانك لخانة الصّناعة العض: العربية 3 الصّعوبة تمكات» تقلكا لطينة اللحة 
العريّة الاشتقاتيّة؛ حيث تتعدّدُ أناط الكلمات الدَالَّة على وحدة مُعجمية مُعَينقَه عل 
تح وهنا تعد فى الال كت »يكن تكش» تكرلة»:) الدَّالةغل الوحدة (كقتك): 
الأمر الذي يستدعي مُعالجاتٍ صرفيةِ دقيقة. 
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هذه الطبعة إهداء من المركز 
ولا يسمح بنشرها ورقيا أو تداولها تجاريا 
:ا ييا 


: - لهال ا لمعجميّة الآليّة في مراحل الصّناعة 
تر الصّناعة الحث” لإلامهرع مله[ 2 مراحلٌ أساسيّة 0 -- 
والتُحريره والتّشر. وتتخلّل كُلّ مرحلةٍ مجموعة من المراحل الفرعيّة التي تتحدٌ 
ضوء طبيعة العجم والحدفٍ منه ولراك اا زات الي الل ل شت 
تنفردٌ بها مرحلةٌ مُعينة؛ لكنّها : تتم في المراحل الثلاث, بأساليبَ وطرائقٌ مختلفة. وبيا 
ذلك على النّحو الآتي: 
-١, 0‏ العاجة الآليّة في مرحلة الججمع 
0 ا المورد الأساميّ الذي كر ن غنة ماذة ا مجم . وإذا أردنا 
نصنمَ مُعجمً) أُخويًا مدلا لواقع اللّخة الطَبيعيّةه اي ا 
- اللَْوي. فقا لضوابط الصّناعة الح الحديثة» فإنّنا نصنع م فيك لمادّة 
المحجم لاي 15 مورة الرّئيس] ف صورة 1 أخوية 35) 1 ويشارٌ 
امون اللّويّة إلى كُتلةٍ غير مُنتظمة من النُصُوص المُستمدّة من واقع اللّخة المي لم 
وفقٌّ أساليت إحصائيّة» بم| يتناسبٌُ مع الأهداف المنشودة؛ ويُمكنْ التَحَكُمٌ في بياناتها 
بالإضافة أو الحذف أو التعديل. 
في الصّناعة المحجميّة ينبغي أن تكون الْمدوَنة ال يلا حقيقيًا للّغة المجتمّع؛ 
سواء اللّغة المستخدّمة فعليء أم الي كانّت مُستخدمة في - حقبةٍ زمنيّة أو مكان مُعيّن. 
هذاء فنا تشتملٌ على أعدادٍ هائلةٍ من الكلمات؛ تصلٌ إلى الملايين» وتتجاورٌ الآحاد إلى 
غشرات وكات ا ملايق فق يحض الأهياة: وبطيعة الخال»فإن تحال هذه الأعدا دمن 
الكلمات ستكون بحاجة إلى وقتٍ وجهِدٍ كبيرين» نما يستدعي توظيفٌ الآلة على نحو 
تسحدق معة الدّةٌ والشرعة. 
تستدعي الحاكَة الآليّة لمكوّنات الُحجم في مرحلة الجمع إخضاع الْدوّنة للمُعاكَة 
عبر مُستويّين هما: مُستوى مُعاجَة المباني» ومُستوى مُعاجَة المعاني؛ وذلك باستخدام 
أدواتٍ مُعيّة (سيأتي الحديث عنها لاحمًا). وينتجُ عن المستوى الأوّل: (المداخل 
والوحدات الُْعجميّة» ومعلومات التّكرار» والمعاني الوظيفيّة)؛ وعن المستوى الآتحر: 
(المعاني المُعجميّة والمثقول والعلاقات الدّلاليّة والمعلومات التَّاريخِيّة والتأثيليّة: 
والشواغد وتسهويات الاستعال»4 


١ 
: 
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*, 1- المحاَة الآليّه في مرحلة التّحرير 

يقوم تحرير المعاجم الحديثة على نظام التحرير المي مم1[ 
حمع وز أو ما يُعرَفَ ار صناعة الج عسمتطوتاطن/ ممع ملمءط 0 
ده ةل؟. وهو بيئةٌ حاسوبيّةٌ تفاغليّة» تشتمل على قاعدة بياناتٍ للمعلومات ال 
وأداٍ للتّحرير المحجميّ وأذوايق كوارة الوازة اللّخَوية والنكية ونام 
اللحخدمة في صناعة المحجم» » بالإضافة إلى الواجهة التفاعلية لنظام ااتحوين وناك 
نظامٌ التحرير الحجَميّ على إخراج هيكل الْمعجم في صيغةٍ قياسيّة ومُتتظمة تتوحدُ فيها 
مناهج المحرّرين المشاركينَ في صناعة المعجم. 

والواقعٌ أنَّ أنظمةً التّحرير المحجميّ ليسّت أدواتٍ للمُعاكّة الآليّه المعجميّة 
بقدر ما هي أنظمة للتّحكم وإدارة البيانات. فهي ساعد على استقبال رجات 
امُحالكَة الُعجميّة ووضعها في ميكل مُننظم؛ يُمكنْ التّحَكُمُ فيه واستخلاص مُعطّياته 
وإحصا داقة وو افد افلم اللكرير كذلك في ضبط الحُقول والعلاقات الدّلاليّة بن 
المْمُرَدات» ونمذجة المعاني لحت للمفرّدات الّتى تتبعها. وتتفاوث درجة ةَ الإفادة م 
أنظمة التدزير المععيرة فق إدارة المعلومات المحتم 0 قدا الطنيعة كذ المدلومات وددة 
المْخْرَجات النّاتجة 00006 اناده لعي 


", #- المعاسكَة الآليّة في مرحلة التّشر 

إذا كان بالإمكان 0 الآلة في استخلاص المعلومات المعجميّة في مرحلة 
الجمع» كم : في التّظيم والتَرتيب وا ميكلة في مرحلة التّحريرء فإنّ دورّها 
مدل را على الموانب الفنيّة في مرحلة المَّشرِ؛ حيث يكون التَّركيزٌ على 

خراج لاك لعي ف عورة ثقانن للكيكسين فجديمعها أهذاف الصتاعة 
هذا فإنَّ المُعالجة الآلهَ لمكوّنات المحجم تاشترعلة الندن لا درم بالك ناض الاسات: 
بشكل مُباشر؛ لكنّها : ترتبطٌ بالمكوّنات التي تتفرّعٌ عنها ٠‏ وعلى سبيل المثالء توج لَه 
الآليّة إلى ضبط الوسائط المتعدّدة هنلع صم 1ن]2/1 الي ت: تتبع الوحدات الي ومعانيهاء 
كالأشكال الُوضيسية والُسومات التي تُستخم في شرح للمنى [في الماجم الور 
والصّوتيّات والمرئيّات [في المعاجم المنطوقة]؛ ىا يُستفادُ منها في ضبط مرّجات المعاجم 
الُْوبهة إلى ذوي الاحتياجات الخاصّة. 


نم#”:”#8 ا - 


هذه الطبعة إهداء من المركز 
ولا يسمح بنشرها ورقيا أو تداولها تجاريا 
| > لط ييا 


4- من أدوات المُعاجَة الآليّة لكوّنات المعجم اموي 

١‏ هُنَاكَ العديدٌ من أدوات امُعاجَة الآليّه الي يُمكنٌ الإفادةٌ منها في مُعالَّة مُكوّنات ا محجم 
اللُغويّ. ويُوضّحٌ (الشّكل 1-7) أبررٌ أدوات المحاكحة الآليّة المعجميّة في اللّغة العربيّة: مع 
الإبانة عن المعلومات المعجميّة التي يُمكنٌ استخلاصّها عن عمل هذه الأدوات. 


المداخل والوحدات 


- نظام الفهرسة الآليّة 
معلومات التذكرار 


1 


542 


الشُّوا 


مُستويات الاستعمال 


ع 


المداخل والوحدات 


المعاني الوظيفيّة (البنويّة) 


ّ 


و 


أدوات معا 


جَةَ مُكوّنات 


المعاني الوظيفيّة (التّركيبيّة) 


المعانى الميعجميّة 


كي 
عدصت | 


2 


المعجم اللَعَو 


يِ 


المعلومات التَأثِيلبٌة 


أ 


المعاني الميعجمة 


الُقول والعلاقات الذّلاليّة 


محلوناتة المتجاء والنطق نظام المعاَة الصّوتيّة الكتابيّة 


الشّكل >-1 :من آدوات العا لَة الآلية المعيحميّة ف اللّغة العريئة 


-15155- 


اك كل سير ا 
يعمل نظام الفهوسة الآليّ ©«1006 14 على إعادة ترتيب ارات الممَصَمّنة في 
امْدرّنات اللغويّة؛ كا يُساعدٌُ على إحصاء ترددات هذه الرَدات في النصُوص. “مق 
ران كنات العم لكل خارص الال والوطااك العف 
وتكبية بعلومات التكراق ‏ ومظفينة: انان فإن خرجات هذا التّظام توف الوقت 
وَالجُهدَ لا سيَّا عند التّعامل مع أعدادٍ كبيرة مج وض لكنّها في الوقت ذاته 
لا ُغني عن التَّدخلٍ اليدويّء لضبط رجات الآلة أوّلَا ثم لَك من مُوافقة هذه 
اله نايف لقلديةة اللخقاوهداك تاكن ل 
العوركة وإ الدلفف وق طراق فاليا صوص هي 
ّ لوط نر عد اد و ا 
- نظام الفهرسة الجذعيّة: : ويقوم بترتيب المْمَرّدات وفقّ اجُذُوع 515 بعد 
رهام لوقن[ الكووانت ولاك 
- نظام الفهرسة الجذريّة: ويقومٌ بترتيب الفرّدات وفقّ الجدُور 110015؛ ويستدعي 
هذا الَظامُ وجو آليِّالإزالة الالتباس البنوي بن الْرّدات المُتّقة في شكلهاء 
المُختلفة في أصلها؛ على نحو ما نجدٌ مثا في كلمة [قَلَكَ]؛ حيث تذُلٌ في 


صورتما امقرّدة على الفعل الماضي من الجذر (ف ل 2) وتدلٌ أيضًا على حرف 
الحرف (ل) الذي تسبِقٌةُ فاءُ الاستئناف» وللعئانه كاف الخطاب؛ ونحو ذلك. 


والواقع أن طبيعة الّغة تتحكمْ بصورة كبيرة في اُهد البشريّ البذول لاستخلاص 
الال والوسدات الحفية ؛ بل إِنْ منهج الَرْتِيب المعجميّ في معاجم اللغة الواحدة 


وشو 


دار اام 0 ا إلى مجهود 


والمولنديّة لذي لخاك الضافة كا العريّة: ات دن نظرًا لطبيعتها 
الاشتقاقيّة ونظامها الكتابي. 


-/11 7ت 


هذه الطبعة إهداء من المركز 
ولا يسمح بنشرها ورقياً أو تداولها تجارياً 


4 , 1- الكشّاف السياقي 

يتمم الكشَّافٌ السّياقيٌ 13261 عمل نظام الفهرسة الآليّةة حي يُعنى 
بتعيين سياقات كل مُفرَدةٍ على جدة» بعد إخضاع جملة نُصُوص المدوّنة للفهرسة الآليّة. 
ويُساعدٌ الكشّافٌ السّياة فِيّ بذلكَ على استخلاص العاني المعجميّة من السّياقات؛ إذ 
يكن اللتيان معنى الُفردة حال استخدايها في امجَمَع اللخوي. ويفيدُ الكشّافٌ 
السّياتنٌ أيضًا في استخلاص الشّواهد المعجميّة؛ كا يُساعَدٌ على تعيين مُستويات 
الاستعمال. 

ونظرًا للتّداخل الواقع بين الكشّاف السّياقيَ ونظام الفهرسة الآلد لية» فكثيرًا ما 
نجدذههما ف أداةٍ واحدةٍ للمُعاجّة: على الحو الوارد في (الشّكل 5-5), 


كن نوو عه لكان هن تسم 
عذى خذ قوف سكرب « أدين ها فيها أن عسنها 
وقو بلاس الشيد القى أحسى. فته بثوب الزيارة. قرأك 


مسر الابقران, فقالت: ينا أحسي هذا النوكق وها أسعد 


5 :. 
بر 
قب 
لجسايه _ 
لمسه 


العرفة وشر ينوك: ما احسيي هذا اليرا وكبي لآ 


فا 


كن حايه؟ - ايه ها أمسس هذا الفوك! حلت أطارجلة 


1 


فنا الكلاف. ل عا أحسى. هدس الفرؤسين! انهذا سيفيفان 
وحذاء فكثاتت هده تدفييه أحسن وهب وأشهى بأعدب يا 


أرس. ويتقات الزهار ايه أعسين وعيققر ليها أنفى ومن 


0 


00 
11 


آلا 
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؛ و - نظام التّحليل الصَّري 

لمحلل الصَّرفٌ أحد اهمّ أدوات مُعاكّة الَّرَدات في اللّغة العربيّة؛ حيث يقومُ 
بتعيين جُذور الكلمات [أو أصوها] وتحليل كَل كلمةٍ على عناصرها الأرَليّ (الجذوع 
وَالسُوايق: واللواحق). بالإضافة إلى تعيين الفْروع 1 الي كد شك صرفيًا 
للوحدات المعجميّة. ويهذا إن نظام التُحليل الصّرف مم أيضًا عمل المفهرس الآلي؛ 
حيث يضعٌ المداخل [المثلة في الجذور] والوحدات الحجميّة [الْمَدْلةِ في المرُوع] في 


الصّورة التي ينبغي أن تظهرٌ عليها. ومن ناحيةٍ أخرىء يُساعدٌ المُحللُ الصَّرقّ على 
تعيين المعانى الوظيفيّة البنويّة ة للوحدات المعجميّة. ويُوضٌحٌ (الشّكل 3-") نموذجًا 
رجات التعليل القدرق ف[ العريئة: 


5 د 001701 


عد اعم د . 
1 2 6 2 
١‏ | 0 | تف | غنا ئراط إن إن لزدزتروئنرحةترف ‏ | 5تدتئ | 
١‏ اللا | ترف | غلا إسرلاط الاق إفب لدنص 0 
اد ا 2 لحك 
تح ل ا كل لح 57 جر تك الاك 
2-2 :7377-70-57 مك 1 كا 
0 فق لح اسستعفئ 0ط ترد | 6 | 
ضة |لاقرف | اتويت د إن موت سوتخاضد__ | 4 
| 00 | دقرف | ساع تند لل إبع أصويتربوورترءترف_ | 4[ 
3 0ه لاحت كنا 02 هه 5 3 :755ل 1 
مكرك 5 وو ل 25 2 لو الس 
0ت _الاشيد ]ع سردل لط إن السشيديافك _ | يا 
الك 0 ل 2 7 777 ا لك 
لويذ |-الترة | اعرف إضاءة مقط انما _أضروأودسزتسموب تي حل اتقو 
ا ل ا 


الشّكل 7-: نموذج لمُخرّجات نظام التّحليل الصَّرقّ في العرييّة (أداة لله اله) 


ات 


هذه الطبعة إهداء من المركز 
ولا يسمح بنشرها ورقيا أو تداولها تجاريا 


؛ و 4 - نظام التّحليل الَّركيبي 

يقو م الن الك 2 92 عناعةام 959 بتعيين أركان الجملة الي رك 
بأقسام الكلام حاءعءء م5 01 5مة”ل؛ كا يقوم بتعيين وظائف هذه الأركان وتوصيفها من 
التّاحية المّكيبيّة. والواقٌ أنَّ طبيعة الترّكيب في اللّغة العربيّة تستدعي تداخلا بِينَ عمل 
المُحلّلات التَّركييبّة وأدوات إزالة الالتباس الدَّلاليُّ نظرًا لعدّة عوامل؛ منها: مَبُول 
الجملة العربيّة الواحدة للشّّع بين الاسميّة والفعليّة [لا سيّا في العربيّة المعاصرة]» 
وتغيّر أطوال الجٌملة بصورة غير مُطّردة» وواقع الكتابة العربيّة الي تتجرّدُ في كثير من 
الأحيان من علامات الصّبط بالشّكل» وغير ذلك. ويقتصرٌ وورٌ الملل الركين ف 
صناعة ا مجم على تعيين المعاني الوظيفيّة الثّكيبيّة لوحدات المعجم. 


لونغ بيتش (الولأيات المتحدة) [5-) 2000 ... 5 حياة المتشرد ستيغن كنت عندما عئرت عليه 
شقيقته بعد عناء طويل لتبلغه ياثه يرث 3اللالف دولار ربائه بات ققدرا على رضع حد لعشرين ستة عن هياة التشرد في 
.شوارع مدينة لونغ بيتش في ولاية كاليقورئيا 


اانا جنا 0001 قاظام_معاثر 20000715 


5و رموه مه 
كت عط تمومدك وطاء ‏ 1)ع+ تعر _جامع بحيب جوم 
+ تهناننه7 مط تووححدك و5 + 6682867 _وؤقع؟ د دود 
يتوموء 


لوه 067 

8 #اعدياى 1 : باح 6ه * ؟: 46 ١‏ 1 0/2 
+ 505014 عسات + 186 1112 1151757 اراق د11 
عونه» دز ووت أدمل وماهم + وطمن يود و +1 7ع 113 د _امطاامع توي 
+ ين 1أقصم موتمطء + [.هه. عيجه]) وين 1ع +ازع :1 ومع اووورت 1 
1161727 تاعانا+ 1125 

7ع 114097 _ اننا كد11 

اع جعك_6دع” 
0 


الشّكل 5-5: نموذج لآليّة التّحليل الث كيبىٌ فى العربيّة ولصوطءعم عتطوعةى صدءط) 


الاب 


؛ و ه- نظام التّحليل الدّلائيَ 

وت عمل الخلن الدّلايّ 2م عاسقدرء5 على المعاني الدوة للمفرّدات 
في سياقاتها . ومن التّاحية العمليّة في مُعاجّة مُكوّنات المعجم؛ ينبني نظام التّحليل الدّلاني 
على ما عرق بآليّة 55 الالادق الدَّلالي للكلماتِ 0 عقمء5 11/010 
)2 وود هذه الله فكرّتها الأشايةة من المتصاحبات [اتلازمات] اللفظِية 
002105 الي َتَكَرَن عن سِلسِلَةِ من الكلمات» َتَلارَمُ مُفرّداتها في عَلاقَةٍ ب ركيب بي 
كَعَلاقَة الفعل والفاعل (مثل: صاحّ الدّيك» ساد الصّمْت)» وعَلاقة الإضافة (مثئل: عابر 
سَبيل» قاطع طريق). ويُستفادُ من نظام التّحليل الدّلايّ في استخلاص ال معاني امعجميّة, 
كمرحلةٍ تلية مرحلة الكشف السّياقيَ» خُصُوصًا عند اتام مع مجموعاتٍ كبيرة من 
السّياقات شه كا تفن جُزيِ في استكشاف العلومات التي وليه حت قال 
عَلنها سياقات الوعحدة المسسحمة وهل سيا المثال» سترتبظٌ الوّحدةٌ (القطار) باللّْة 
الغريّة القديمة إذا صاحبّنها كلاتٌ مكل (العيَكه الخُشب» ...)4 وبالعربيّة الوسيطة إذا 
صاحبّتها كلماثٌ مثل (القافلة» الإبل» ...)» وبالعربيّة الحديثة والُحاصرة إذا صاحبّتها 
كلماتٌ مثل (التّذاكر» السَّكَّة ...)؛ وهكذا. 


١‏ م السّياق الدّلالة | الرّمان | المُستو ى أ 
١‏ وَإِستبّحنا سَنامٌ الأرض إذ قَحِط القطازٌ 150 س4 الندية 
1 أنزلٌ الدَارَ الْبَنَاةَ على سُقيا القطار 2 ١١‏ الا | «القدوهة 
فلآح لهم من بَعْدٍ قطارٌ إبل 3 5ه | الوسيطة 
3 ومن جملة ما كان معها قطار جمال محَمَّلَة "3 5ه | الوسيطة 
5 ثم سافرٌ إلى بلده على القطار الحديدي. :هاه | الحديثة 
1 هامّت 6 عل المرافيع أو محطّات القطار ع« | #مماه | الحديثة 


الجدول 4-5 : نموذج للمُتصاحبات الدَالَّةَ على مُفرّدات العربيّة في آليّ التّحليل الدٌّلال 


3 او اجات 

يع شبكة الكلمات 770507166 موردًا رئيسًا في الصٌّناعات اللخوية الحاسوبية. 
وهي ليست أداةً للمُعاَة الآلبّة ابحرم الدق + لكنّها تيد 2 لَّ بالمعارف» 6 
جد لاتمام م113 1ن لاماي لما اوناك اش ل ل كل كرك انا 
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هذه الطبعة إهداء من المركز 
ولا يسمح بنشرها ورقيا أو تداولها تجاريا 
+ ب ل #ط#ط##ط#ط-غ غ سيا 


قاعدة بيانات مُعجميّة د 6 من تأصقح 6201601-5 1 تصنت المْمَرَداتُ فيها 
إلى أقسام الكلام د 3 تُصِئْفَ تَصَنَفَ في سلاسل عوعات من المرادفات 5 أو 
المفاهيم ل التي ته تتَفْق في معانيها 57 فيا بينها بشبكة من العلاقات الذلاليّة. 
وبهذا التّوصيف» كر الإفادةٌ من شبكات الكليات عند مُعالَة مُكوّنات ت ا معجم 
اموي في تتبّع بع المعاني الح 3 والاستدلال عليها؛ ىا يستفادُ من شبكات الكلمات 
عن مروت رتور ضري لمجاك لكر أ 


6ن اووس نا 1 مدت ودندا أ“ 


* دمل اي عاذ ييار 
مما 
ا العممود كه امم بزبى لعمممه د اعوخر 
عمل صل بشرى_قم لفطل نان فمل بشرى,ندالط إلسائى نداط يتعرى 
نمل مامد او حلت 
غاقة بوء من نمل يذب نوع بل فمل لض لوع من نمل. ككم ع« + من نمل 5 بوع بن فمل تناج نوع بل فل نحقه نوع ين دمل سكن بوع من ابئل 


ع اعملصساعي بوع بن نئل تصليية نوع من فمل. نشاط بوع من فمل. توازيع نوع من فمل. شرعية نوع من فل خلول بوع من فنل. لداس لوع من فمل. .نكوث 


ل ا ل اك سانيا 


الشّكل 0-5: نموذج لشبكة الكلمات في العربيّة (ا©7/0071 41016) 


5 ./ا - نظام المعاكَة الصّوتيّةَ الكتا 


الفونيم 20006136 هو وّحدة اتحايل 5 قناللقات اليد ل ريا 
المنطوقة, وا ف الصّورة المكتوبة (الجرافيم تمعطاصة7©) الذي يَعَيرٌ عن أشكال 
المحارف. ويَستَحدَمُ لمحلل الصَّوقٌ الكتابي 11م 5-6 -0ممطاط في 
تعيين معلومات الحجاء والنطن» حر حاكاة القواعد القياسية نيه لأصوات اللةاتوخارقها. 
وفي اللّْغة العربيّة يبدو هذا النَظامُ في صُورة ما يُعرَفَ بآليّه رَومنة الخرُوف العربيّة 


- 71715 


عأطوتخ 01 22100 1مقمطه]] ؟ أي كتابتها باحرفٍٍ رومانيّة [أو لاتينيّة]؛ حيث تل 
محارفٌ الألفبائيّة الصّوتيّة الدّولة مكان خارف اللّغة العربيّة؛ وفي بعض الأحيان» 
كرد ده لال الما بط أخرى للتّحليل الصَّرقٌ أو التركيبىٌ. 


ا م | الوحدات المعجميّة | قِسمالكلام | الصّورةالمنطوقة | الصّورةالمكتوبة 1 
1 كدي فِعل م ما ]1 كنب 
1 عاهد فِعل 220 عاهَد 
: استأئرٌ عل امامل اماك اسْتَأَئرٌ 
1 اللّيل ايع درن -أنراا-2/11 3 
0 الذي 5 70000 الذي 
1 الود اعم إإن-1210ن نر 2 وٌّ 
7 النّساء اسم 2مك ةدتمم نِساحٌ 
0 إِنْ حرف / أداة 2711 إِنْ 
4 أنْ حرف/ أداة 2/7/1 أَنْ 
06 0 حرف / أداة تزاس] اك 


الجدول 5-:: نماذج رجات المُعاكَة الفونوجرافيّة [الصَّوتيّة الكتابيّة] 


ه- أفكارٌ بحنيّة لأطروحاتٍ علميّةِ ودراسات مُستقبليّة 


١ 0‏ لئدرة ره م كيت ا 3 0 الماك امعجميّة الآلة وحداثة 


الخ 0 


2 


6 


هذه الطبعة إهداء من المركز 
ولا يسمح بنشرها ورقيا أو تداولها تجاريا 
:ا ييا 


اه 3 
و١‏ - موضوع الفكرة الأولى: 


01 و 
أنساق المداخل والوّحدات في المعجم العربّ المعاصر 
الدوابية و8 ]| حصان 


* فكرةالدّراسة: 


6 


تقوم فكرةٌ الدّراسة على حصر وإحصاء أنماط المداخل والوحدات الُعجميّة في 
بعض المعاجم العربيّة ا محاصرة أو أحدها؛ وتعبين الأنساق المُختلفة للمداخل 
حينَ تكونُ أصُولًا أو جُذورًاء وللوحدات حينَّ تكونٌ مُفرَّدةً أو مُرَكُبة؛ ثم 
ضبط هذه الأنساق على أساس منهجيٌّ يُساعدٌ في تقويم صناعة المعجم العربي. 
مادّة الدّراسة: 

عضر 1 أر اكتر] للخ العرالة حامر 

الأسبئلة البَحئيّة: 

* ما أنساقٌ المداخل والوحدات في الْمحجم العريّ ا حار ؟ 

* كيف يُمكنٌ استخلاصٌ منهجيّة لضبط بنية هذه الأنساق في صناعة المعجم؟ 
منهج الدّراسة» ومجال البحث: 


تقوم تقوم الدّراسة امقتيحة عل منهج الوصفيّ التَحلِيلٌ» ويَتتَوّعٌ حال البعق بون 
الإحصاء اللَتَوَيٌ والصّناعة ا 


و 7- موضوع الفكرة الثانية: 


نحو مُعجم حاسُوبٌّ تفاعُلٌ لذوي الاحتياجات الخاصّة 
«المنهج والتمودّج» 
0 


والنّدر): مكلو ل مل ااه شافلتك 9 مساعدة ذوي الاحتياجات 


الات 


الخاصّة من فاقدي القّدرة على السّمع أو الإبصار على فهم اللّة وتعلّم مُفرّداتها 
وإدراك نظامها المُعجميٌ؛ مع تقديم نموذج حاسُوي يُبتُ الباحث من خلاله 
فاعلية المنهج. 

* مادّة الدّراسة: 
مُعجمٌ عرب مُعاصِرٌ [أو مجموعة من المعاجم]ء و مره ل ة للعربيّة 
المُعاصرة» وقاعدة بيانات دلاليّةَ مُعجميّة. 

* الأسئلة البحزيّة: 
* ما ضوابطً صناعة مُعجم عرب لذوي الاحتياجات الخاضّة؟ 
. إلى أيّ مدّى يُمكنْ بناءً وتطوير مُعجم عرب مُعاصر في بيئةٍ حاسوبِيّةِ تفاعليّة؟ 
٠‏ كيف يُمكنٌ توجيةٌ الفئات الُستهدّفة من تعلّم الَُرَدات ومعرفة المعلومات 

ميخي عن الآلة دون وشيظ شرع ؟ 

منهج الدّراسة» ومجال البحث: 
تقومٌ الدّراسةٌ المقترّحةٌ على المنهج الوصفيٌ ويَتتوّعٌ جا البحث بين اللّسائيّات 
لحاسو والمناضة كي 

5 ا 3 
ه , - موضوع الفكرة الثالثة: 
3 ظَُ 1 2 لق 
التوليد الآنّ للمعاني في معاجم اللّغة العربيّة المعاصرة 
«مُعاَة حاسوبيّة في ضوء تقنيات إزالة الالتباس الذّلالىٌ) 

*» فكرةالدّراسة: 
تُعالِجُ الدّراسةٌ المُقبرّحة أحدَّ أهمٌّ إشكالات الصّناعة المُعجميّة الحديثة؛ 
ونعني إشكالٌ استخلاص المعاني المُعجميّة من السّياقات. وتقومٌ الفكرة على 
بناء مُدوَّنةٍ لوي للعربيّة المُعاصرة. ثم إخضاع مادّتها للتَّدرِيبٍ والتّجريب على 
تقنيات إزالة الالتباس الذَّلاليّ والإبانة عن فاعليّة هذه التّقنيات في استخلااص 
المعاني وتوليدها آليّاه وتقييم بيم المَخْرّجات استنادًا إلى معاجم عربيّة مُنِجََةٍ سلمًا. 


0 


هذه الطبعة إهداء من المركز 
ولا يسمح بنشرها ورقيا أو تداولها تجاريا 
:ا ييا 


* مادَّة الدّراسة: 
مُدَوَنةٌ لَعَويةٌ مكثوبة (نَصَّيّة) مُستَمَدَ ُستَمَنةٌ من نُصُوص اللّغة العربيّة المعاصرة 


لتكونّ مادَةَ للتّدريبٍ والتّجريبء ومُعجم عرب مُعاصرء ليكول مادَةً للتقييم. 
» الأسئلة البحزيّة: 
. ما شك المعنى في المعاجم العربيّة المُعاصرة: وما ماه وما هي القرائن 
اللخوة الى لمك الانعدلا ااهل الباق اللاي للق دة الواحدة؟ 
*؟ كيف يُمكنٌ توظيف تقنيات إزالة الالتباس الذَّلايّ في استخلاص المعنى 
وتوليده؟ 
٠‏ إلى أي مدّى يُمكنُ توظيف هذه التقنيات في مُعاَة إشكالات صناعة 
المعجم؟ 
*؟ منهج الدّراسة. ومجال البحث: 


قر الثرايت الاريسة عل اليج الوم صفيء ينوع مال السك ين اللسبانات 


ه, ؛- موضوع الفكرة الرّابعة: 
نيحو قاغدة بياناث شَرَكْية دلاليّة لأغراضن الصّناعة ا معيحدية العريئة 

* فكرةالدّراسة: 
فت الذرابة الكل وئحة إل وام و طون كاعد بانائف ميد اطلدر لو الجاذقانع 
الذُلالّة لتكون موردًا للصّناعة المعجميًة العربيّة. وتقوم م الفكرةٌ عل إعداد 
ما يُسْبهُ ا ميكل أو الودج النفية لشبكة كلماتٍ 4 تستملٌ مادّتها 
ومُعطياتها من واقع اللغة العربيّة المُعاصرة» لتكونّ قادرةً على تمثيل ا معاني 
المُعجميّة على نحو دقيق, مع تقديم نموذج مُعجميٌ مُستَخلّصٍ منهاء للتأكد 
من مناسيّتها لأهداف الصّناعة. 


موت 


* مادَّة الدّراسة: 
شبكة الكلات العربيّة 1710:0714 3616:ى. وعدد من شبكات الكلمات 
والالطرلر عات التقنكوة لكات الكخرى 

٠‏ الأسئلة البَحزيّة: 
كيف نبني قاعدة بيانات دلائية مُعجميّة للعرييّة؟ 
كيف يُمكنْ توظيفٌ شبكة الكلمات في تطوير قاعدة البيانات؟ 
ماالعلاقات الأساسيّة في قاعدة البيانات المنشودة» وكيف يُمكنٌ توليذها 

آليّه وإلى أي مدّى يُمكنٌُ اففادةٌ من مرّجات التَّوليد الآَلّ؟ 
منهج الدّراسة» ومجال البحث: 


اف ارح على ب م صني وس ال التحفاون اللسانات 


ه, ه- موضوع الفكرة الخامسة: 
بناء وتطوير نظام مفتوح المصدر للتّحرير المحجميٌ العربيّ 
(مُعالَة حاسوبية» 

* فكرة الدّراسة: 
مع وُجود عددٍ من أدوات التُحرير المُعجميّ» ا أنَ اكثرّها لا يدعم الل 
العربيّة 0 كاملا ولا يتناستٌ مع بنيتها المُعجميّة. لحذاء فإن الدّراسة 
المُقررّحة تسبي إل ببناء واتطوير نظام للتّحرير المُعجميّ العريّ» يتناسبٌ مع 
طبيعة اللّعة العربيّة من ناحية» 0 مفتوح حَ المصدر 5011166 0261 من ناحية 
أخرى. والهدف من ذلك تمكينُ الباحثينَ من استخدام نظام تحرير مُعجميّ 
غريٌ بلا قَيُودء وتمكين العاملنَ في حوسبة اللّغة والعربيّة وتقنياتها من تطوير 
ذلك النظام وإثرائه. 


-/ا”8- 


هذه الطبعة إهداء من المركز 
ولا يسمح بنشرها ورقيا أو تداولها تجاريا 
:ا ييا 


* مادَّة الدّراسة: 
مجموعة من المعاجم العربيّة المُعاصرة» وقاعدة بيانات مُعجمية قياسيّة 
للددويت: 
٠‏ الأسئلة البَحزيّة: 
يا ما المواصفات القياسيّة لنظام التّحرير المُعجميّ العري؟ 
٠‏ إلى أيّ مدّى يُمكنٌ الإفادةٌ من أنظمة التّحرير المُعجميّ في صناعة مُعجم 
عربي؟ 
ماالخُطوات المنهجيّة لبناء وتطوير نظام مفتوح المصدر للتّحرير المُعجميٌ 
العريٌ» وما الرّؤية المُستقبليّة لدعم هذا النّوعَ من أنظمة التّحرير؟ 
منهج الدّراسة» ومجال البحث: 
تقومٌ الدّراسةٌ المقرّرّحةٌ على المنهج الوصفيّ» ويَتتوّعٌ محال البحث بين اللّسانيّات 
الحاسوبيّة والصّناعة المعجمية. 


-578- 


ببليوجرافيا مرجعيّة 

.5١15 21١ البعلبكّي (رَوحي): الّورد العريّ» دار العلم للملايين» بيروت»‎ .١ 

. السّعيد (اُترٌ بالله): حوسبة المعجم التَاريخَيٌ للّغة العربيّة» مجلّة الُّسان العري» 
مكدب اتنسيق التعروينية اله باعل الديى 2/4 1 


*. السّعيد (العترٌ بالله): علم الدّلالة ونظريّة المعنى دار الهاني» القاهرة» 5011. 


5 السّعيد (المعترٌ بالله): لمدجة ا مجم العربي» يحل الات العربي» مكتب تنسيق 
التعريب بالرّباط» العدد 1/5 .7١15‏ 


ه. عُمَر (أحمد حُتار): صناعة العجم الحديثء عا الكُتّبِء القاهرة» طا7ء .7٠١9‏ 
.١‏ عُمَر (أحمد مختار): في علم الدلالة» دار المعرفة الجامعية» الإسكندرية» 1991 . 


عمَر (أحمد مُتار)» وآخرون: الْمُعجم العريّ الأساميّ» الُْنظّمة العربيّة للتَربية 


والثّقافة والعُلُوم لاروس» 1484. 
4. تجمع اللّغة العرَبيّة بالقاهرة: لبجم الوسيطء مكتّبّة الشّروق الدَّولِيّ القاهِرّة. 
ط 3 .6 رت 


-01328) :12 .5637020 310 قتاع ا5[75 7711105 101611023157 .(2012) .لخ راعطم .9 
1/1151 021010 .513037 2160ع[ عتامماعع81 .(مل8) .121 ,1مندلووط ع .5 راء 
2 رووع]2 517 


,2 ولاء1595 ,.1 ,1]83[قطكلالث ,لآ ,2عناع 100121 ,.5 ,اعتمعلاط ,11 كاعواظ8 .10 
-717010 ع1طوتتث عغطا 1210011128 .(2006) ,.ل) ,لطتتةطلاء] مه .لك رعموءعط 


-0ن) أء 11/010 2110221متتعغص] لختط 1 عطا 1ه دع سصتلععءء2]0 ص1 راعه زمعط ءال 
,22-26 121113197 ,10168 ,1513120 11[عآ 5011 ,2006 011770 رععمعمع1 


-001103) [نعاتاع[ .(2019) .14 رجعطعمة12-5عمطاخ ,.ظ ,2ع5-012م10أمةن) .11 
-0115) 36116[ “لمعم 1102م5 .ك05م0دء1اممكخ لله دععمطو كلك :515(أحمذ لملا 
طاطحطت) تعامعن عع اتكاعد تاعماما 

-0© 010531 طذ ولام قتع مع تع رآ .5 باعتا ,.] بتطعدم؟]! ,./آ م0012 ,.ل ,زوطك .12 
.كاكك 01 17لاعة1] رووع21 15117ء نطلا قطة زاطناز[ .كأعهتاوطظ 1ه ع8001 :قرع 


01 21102 1اممكث له :100115 .(2015) ..اآ ,220011137تتطهخا ,.5 .لظا ربطقةدآ .13 
“0111185 .0010013) 1218511286 
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هذه الطبعة إهداء من المركز 
ولا يسمح بنشرها ورقيا أو تداولها تجاريا 
:ا ييا 


62077 ل .411011571115 310 537201157115 .(2018) .0) زاءعم1013 .14 


-16:21608 01 320520012 ع01111608]آ عط 1 .(2017) .ىل 2 بروماء0117)-5ع11عناظ .15 
.0160 .امه 


بلللعاأقطء17171]]5 :12110112002 20 عمتصدعل/8 .(2015) .0 رعنءطعدآ .16 
.55 5151517[] اأعطاهن) .عع20171»0كا تتتهطء 11[ 220 ,دعمطول تتتمعاط 


-اع1170115 .(2019) .0 و[طع01آ ,.لث ,لقطقتةتتطاعاعخ![-ماعأقطءطم.آ ,لا ,مسد .17 
.55511 110 علتامقصطء5 عطاء15 11501 رعتطموعع ملعا :مع 
00> 00 عك 11طمط0 لعاجنتز0 عل نم1101 


-7آ1 - 5ع دمطء5 .(2019) .2 متعمطاتا20 ,.ل) ,2010ع1121 ,.كا راعع 2 اوداع .18 
0) عت 11طصط0 013161 عل 112161 .ع ستووعءه 0ه تإممغطعة01آ توع10مم 
246 


-862[3 ختط0ل .انعا 10 22321128 1م110 :5ع1مقمطءك .(2015) .1 بكلدة”1اع/1 .19 
.77 2116115111115 1115 


041 31ج 10[ 01 أععق8 عط1“ ,(2008) .5 ,معداء 1لا .20 
.170-159 :18 ,105لءاع.آ ,”115 20ة عطكلة8/1 101661003157 مه 15أوه0) 


-32آ 320 ع01آ 053 زه 810165 :لإطموعمع0ع.[ .(2019) .ل ,0طقام0 .21 
1-1123[ ناجة 1377 01 15157ء011ن] .:قع0001 أرع 806 - (1909-1934) عع510128 
اوتا 


211 .16012:عآ عط1 .(2019) .0 ,81010998 ,.ل ,97ك[2101566[095 .22 
.5 1011215761517 


-00)"“ .(2014) .1 رطواع8 ,.ث ,212210111 ,.ث ,2120113[3آ ,.84 ,11600355 .23 

5 >1 1001161102م عل عططغاة59 مدل 16011536105 أء امتامءء 

0 00116161266) 1016123110131 لاد ,*1ل/لارآ عامط 12 ألمماععموع؟ 5ءط212 

.26-7 اعطمداء8107 .2014 شلذ]!1ن) .عماووءء20 ع3251128[آ عاطوتطم 
.0 011[03 ,2014 


خطة ,ع منصطدع]/1 ,110105 ::طتامعل1 2ه 5:65ة.آ [وعتهدء.آ .(2019) .12 ,وعامنة .24 


.5 121576151 0210211086 .13125112865 513771 علا ما عتتتط 1ن 


-1128 31 10651501115 :11025عث 11 تإأمقتاع 2160ع.[آ .(20185) .4 .71/1 ,امعاعطك .25 

5 101 35[ اةطتسطتن) امتاعصط 01 نإلة01055 تقتمتقحطه] حطذ1] 

-[ ععوم 5ع 21ع1) .0012012 ع1امتاعع11 ع12ون] 20155100215 1دعع.آ له 
1101 ع متطد 1 اأطوظ غتمعلمعمع0 
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الباحثون 


-5851- 


هذه الط بعة إهدا. ء من المركز 
ولا يسمح بنشرها ورقياً أو تداولها تجارياً 
السضطضصضطٌّهه هع ا 


7515 


الدكتور/ مُحسِن عبد الرّازقَ علي رشوان 

وشكل "مضي الدكاذ بقسم الإلكترونيات والاتصالات 
الكهربائية في كُلَيّة المندسة - جامعة القاهرة. تخرّجَ عام 191/1 
وكان الأول على دفعته» وحصل على ثلاتة ماجستيرات» ثم 
على الذُكتوراه من جامعة كوين بكندا؛ أشرف على أكثر من ماثة 
رسالة ماجستير ودكتوراه. يدير الشّركة الهندسيّة لتطوير النْظّم الوَّقَوية قميّة 1201 المتخَصّصة 
فى ال فياك اللخة العريية, 


الدكتور/ لمعت بالله السّعيد طه 

أستاذ الدّراسات اللو يّهَ المُساعد بجامعة القاهرة» وأستاذ 
اللما انس ابروا اللشار ل عون الدوسة نات القلياء 
0 وَحدة الموارد المعجمية بمشروع م مُعجم الدّوحة. 

نَكَمَ نحو ثلاثينَ ورقة علمبّة بالإضافة إلى عددٍ من الكتب 
في المُعجَويّة العرَبيّة والدّراسات لوي المُعاصرة» وأسهم أكتر من عدرة 
مشرُوعاتٍ بحثيّة دول في ميادين مُعابحة الّغات الطَبيعية . حصل على عددٍ من الجوائز 
في مّيدان تخصّصههء منها : جائزة (ألكسو 58050:آ) للوبداع والابتكار في «المَحلُوماتية 
والجعلكة 44501 للح العرية تاقد زة راشد بن حُميد للعلوم والثقافة. 


الدكتور/ أحمد راغب أحمد 

اشكاك الراسات لكوي امقارة» ورئس قشم اللغة 
الريك رذابا بالكامية. الإمناقمية ا لحائية ييا ليزي حص ل عل 
درجة الدكتوراه من جامعة القاجرة عام 004. وَتَكَمَ عددًا 
من الأوراق البحؤيّة في دوريّاتٍ علمية ؛ كما شارك في العديد من 
الكقرات الول الج بحوسية اللحقة ولك عدة مق 11 أنانت 
العلميّة. 


و 4 


دااع لاب 


هذه الطبعة إهداء من المركز 
ولا يسمح بنشرها ورقيا أو تداولها تجاريا 
١ |‏ لغ لغ غ سيا 


الدكتور/ مُحمّد عَطِيّة نُحمّد العَرَىٌ 

حصل من جامعة القاهرة على بكالوريوس هندسة 
الاتصالات الكهربائية والإلكترونيات عام 1145١م,‏ وعلى 
الماجستير في هندسة الحاسبات عام ١٠٠5م.‏ ثم على درجة 
الدكتوراه في هندسة الاتصالات الكهربائية والإلكترونيات عام 
طلم عَهِل بالشركة المندسة لتطوير النظّم الرَّقَمِيّةَ 11 
منذ يوليو 1146م إلى نهاية ١٠١٠م,‏ وبينَ عامَيْ / ١٠٠5م‏ و ٠١‏ ١م‏ أستاذا زائرًا في 
كلية الحاسبات وتقنيات المعلومات بالأكاديمية البحرية للعلوم والتكنولوجيا والنقل 
لحري د ترح القاهرة» ومخطّطًا للبرمجيات بشركة «لوكسور تكنولوجي» الكندية 
(أوكفيل/ أُونْتاريُو) منذ 9١٠٠م‏ إلى الآنء وخبيرًا للغويات الحاسوبية والبرمجيات 
لمشروع «معجم الدوحة التاريخي» بين عامّىٌ 5 ١‏ ٠مو1١١آم.‏ 


الدكتور/ سامح سّعد أبو اللّجد الأنصاريّ 
يعمل أستادًا لنّسائيّات الحاسوبيّة ورئيسًا لقسم الصَّوتِيّات 
واللّسانيّات كاه الأذاي بحاضسة الاسكيدر 8 ومدة !| لكر 
الخوياف الحاسوبيّة العربيّة بمكتبة الإسكّندَريّة. شارك في العديد 
من المشروعات العلمية ود العرافي الايراك البحئيّة المحزية 
بحوسبة اللّغة العَرَبِيّة؛ وغو عَضِرٌ بجمعة اللُسائئّات العَرَبِيّة 
بالولاباف أتحده الأمريكتةوعفية بق كدة لح الشكات الدلذلبة للاسويية العا كا 


4 


-755- 


هذه الطبعة إهداء من المركز 


ولا يسمح بنشرها ورقيا أو تداولها تجاريا 
...سس يبا 


مباحث لغوية 00 


مُقَدّمة . 3 
حَؤْسَبَة اللَة العَرَبِيّةَ 


يُصدر مركز الملك عبدالله بن عبدالعزيز الدولي لخدمة اللغة العربية هذا الكتاب ضمن سلسلة 
(مباحث لغوية). وذلك وفق خطة عمل مقسمة إلى مراحلء لموضوعات علمية رأى المركز حاجة المكتبة 
اللغوية العربية إليهاء أو إلى بدء النشاط البحشي فيهاء واجتهد 4 استكتاب نخبة من المحررين والمؤلفين 
للنهوض بعنوانات هذه السلسلة على أكمل وجه. 

ويهدف المركز من وراء ذلك إلى تنشيط العمل # المجالات التي تَنَبِّهِ إليها هذه السلسلة: سواء أكان 
العمل علميا بحثياء أم عمليا تنفيذياء ويدعو المركز الباحثين كافة من أنحاء العالم إلى المساهمة 4 هذه 
السلسلة. 

وتودٌ الأمانة العامة أن تشيد بجهد السادة المؤلفين؛ وجهد مُحرّرَي الكتاب» على ما تفضلوا به من رؤى 
وأفكار لخدمة العربية 4# هذا السياق البحثى. 

والشكر والتقدير الوافر لمعالي وزير التعليم المشرف العام على المركزء الذي يحث على كل ما من 
شأنه تثبيت الهوية اللغوية العربية وتمتينهاء وفق رؤية استشرافية محققة لتوجيهات فيادتنا الحكيمة. 

والدعوة موجهة إلى جميع المختصين والمهتمين للتواصل مع المركز؛ لبناء المشروعات العلميةء وتكثيف 


الجهود, والتكامل نحو تمكين لغتنا العربية: وتحقيق وجودها السامى 4 مجالات الحياة. 


الأمين العام للمركز 
أ. د. محمود إسماعيل صالح 


9 1786 03 82 8 
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